\extitle{7}{线性变换}

\noindent \textbf{记号与惯例} \begin{enumerate}[label=(\arabic*),itemsep=0pt]
\item   $\diag(a_1,\cdots,a_n)$表示对角线上元素依次为$a_1, \cdots, a_n$的对角阵，即
  \[
    \diag(a_1,\cdots,a_n)=\begin{pmatrix}
      a_1 \\ & \ddots \\ && a_n
    \end{pmatrix}.
\]
若 $A_1, \cdots, A_k$ 是矩阵，
\[
 A_1\oplus \cdots \oplus A_k\coloneq \diag(A_1,\cdots,A_k)\coloneq \begin{pmatrix}
    A_1 \\ & \ddots \\ && A_k
  \end{pmatrix}.
\]
\item 对矩阵$A$, $\rank A$表示$A$的秩，$\Span_c(A)$表示$A$的列空间（即列向量组生成的子空间）。对方阵$A$, $\tr A$表示$A$的迹，$\det A$表示$A$的行列式。
  对矩阵 $A\in \bF^{n\times m}$, 我们也常视 $A$ 为线性映射
  $A\colon \bF^{(m)}\rightarrow \bF^{(n)}, X\mapsto AX$.
    \item 对向量组$S$, $L(S)$和$\Span S$表示$S$张成的子空间。
      一组有限的有序集$S_1, S_2, \cdots, S_r$合并得到的有序集记为$(S_1, \cdots, S_r)$.
      即，若$S_i=(\alpha_{i1}, \cdots, \alpha_{ik_i})$ ($1\leqslant i\leqslant r$), 则
      \[
        (S_1, \cdots, S_r)=(\alpha_{11}, \cdots, \alpha_{1k_1}, \alpha_{21}, \cdots, \alpha_{2k_2}, \cdots, 
        \alpha_{r1}, \cdots, \alpha_{rk_r}).
      \]
      %从矩阵的观点看，
      等号左边可以看作等号右边的分块写法。
      这样写时，我们考虑的有序集通常是向量组。

\item 对 $\bF$-线性空间$V$, $\End(V)$表示$V$上的线性变换的集合。
 恒等变换用 $1$ 或  $\sE$ 表示。
  对$V$上的线性变换$\sA$, $\ker \sA$和$\sA^{-1}(0)$表示$\sA$的核（零向量的原像的集合），即$\ker \sA=\{v\in V\mid \sA(v)=0\}$, $\im \sA$和$\sA V$表示$\sA$的值域（像空间）；$\Null \sA, \rank \sA, \det \sA, \tr \sA$表示$\sA$的零度、秩、行列式、迹。
$\sA$在不变子空间$W$上的限制
      记作$\sA|_W\colon W\rightarrow W$.
      $\sA$的系数在数域 $\bF$上的多项式构成的$\End(V)$的子空间记为 $\bF[\sA]$.
  \item 如没有特别说明，``可对角化''默认指所给矩阵或线性变换在其定义的基域上可对角化，
    而不是说在复数域上可对角化。
\end{enumerate}

\section{作业题}
\paragraph*{习题 7.1\quad 线性变换}

\begin{exercise}\tiyuan{\cite[P219, 1]{PWS19}}
判断下面的变换是否线性：
  \begin{enumerate}
    \item \tiyuan{\cite[P219, 1(1)]{PWS19}}%\marked
      在线性空间 $V$ 中， $\mathscr{A} \xi=\xi+\alpha$, 其中 $ \alpha \in V$ 是一固定的向量；

    \item \tiyuan{\cite[P219, 1(2)]{PWS19}}%\marked
      在线性空间 $V$ 中， $\mathscr{A} \xi=\alpha$, 其中 $\alpha \in V$ 是一固定的向量；
    \item \tiyuan{\cite[P219, 1(3)]{PWS19}}%\marked
      在 $P^{3}$ 中， $\mathscr{A}\left(x_{1}, x_{2}, x_{3}\right)=\left(x_{1}^{2}, x_{2}+x_{3}, x_{3}^{2}\right)$;

    \item \tiyuan{\cite[P219, 1(4)]{PWS19}}%\marked
      在 $P^{3}$ 中， $\mathscr{A}\left(x_{1}, x_{2}, x_{3}\right)=\left(2 x_{1}-x_{2}, x_{2}+x_{3}, x_{1}\right)$;

    \item \tiyuan{\cite[P219, 1(5)]{PWS19}}
      在 $P[x]$ 中， $\mathscr{A} f(x)=f(x+1)$;

    \item \tiyuan{\cite[P219, 1(6)]{PWS19}}
      在 $P[x]$ 中， $\mathscr{A} f(x)=f\left(x_{0}\right)$, 其中 $x_{0} \in P$ 是一固定的数;

    \item \tiyuan{\cite[P219, 1(7)]{PWS19}}%\marked
      把复数域看作复数域上的线性空间， $\mathscr{A} \xi=\bar{\xi}$;

    \item \tiyuan{\cite[P219, 1(8)]{PWS19}}
      在 $P^{n \times n}$ 中， $\mathscr{A}(X)=B X C$, 其中 $B, C \in P^{n \times n}$ 是两个固定的矩阵。

\end{enumerate}

\end{exercise}

\begin{solution}
  \begin{enumerate}
    \item 若$\alpha=0$, 是，此时所给变换为恒等变换；若$\alpha\neq 0$, 否，因为线性变换将$0$映到$0$.
    \item 若$\alpha=0$, 是，此时所给变换为零变换；若$\alpha\neq 0$, 否，因为线性变换将$0$映到$0$.
    \item 否。$\sA\left(-1\cdot (1,0,0)\right)=(1,0,0)\neq (-1, 0,0) = -1\cdot \sA\left( (1,0,0) \right)$.
    \item 是。$\sA$可以看作是矩阵$\begin{pmatrix}
        2 & 0 & 1\\
        -1& 1 & 0\\
        0 & 1 & 0
      \end{pmatrix}$右乘，这是线性的。

    \item 是。对$a, b\in P, f=\sum_{k=0}^\infty a_k x^k, g=\sum_{k=0}^\infty b_k x^k\in P[x]$有
      \[
        \begin{aligned}
          \sA(af+bg) &=  (af+bg)(x+1)= \sum_{k=0}^\infty (a a_k + bb_k) (x+1)^k  \\
          &=  \sum_{k=0}^\infty a a_k (x+1)^k+ \sum_{k=0}^\infty bb_k (x+1)^k\\
          &= af(x+1)+bg(x+1) = a\sA(f)+b\sA(g).
      \end{aligned}
      \]
    \item 是，因为对$f,g\in P[x]$和$c\in P$有
      \[
        \begin{aligned}
          \sA(f+g)&= (f+g)(x_0)=f(x_0)+g(x_0)=\sA(f)+\sA(g),\\
          \sA(c f)&= (cf)(x_0)=cf(x_0)=c\sA(f).
        \end{aligned}
      \]
    \item 否。$\sA(i\cdot 1)=-i\neq i=i\cdot \sA(1)$.
    \item 是。对$a, b\in P, X, Y\in P^{n\times n}$有
      \[
        \sA(a X+b Y)= B(aX+bY)C=aBXC+b BYC=a\sA(X)+b\sA(Y).
      \]
      或者 (只是叙述上的差异)，注意到$\sA=\sB\sC$, 其中
      \[
      \begin{aligned}
        \sB\colon & P^{n\times n}\rightarrow P^{n\times n}, X\mapsto BX,\\
          \sC\colon & P^{n\times n}\rightarrow P^{n\times n}, X\mapsto XC.
        \end{aligned}
    \]
      用矩阵左乘或右乘都是线性的，因此$\sB, \sC$都线性，进而$\sA$线性。
      \qedhere
  \end{enumerate}
\end{solution}


\paragraph*{习题 7.2\quad 线性变换的运算}

\iffalse
\begin{exercise}
  在几何空间中， 取正交坐标系 $O x y z$. 以 $\mathscr{A}$ 表示将空间绕 $O x$ 轴由 $O y$ 向 $O z$ 方向旋转 $90^{\circ}$ 的变换，以 $\mathscr{B}$ 表示绕 $O y$ 轴由 $O z$ 向 $O x$ 方向旋转 $90^{\circ}$ 的变换， 以 $\mathscr{C}$ 表示绕 $O z$ 轴由 $O x$ 向 $O y$ 方向旋转 $90^{\circ}$ 的变换。证明：
  \[
  \mathscr{A}^{4}=\mathscr{B}^{4}=\mathscr{C}^{4}=\mathscr{E}, \quad \mathscr{A} \mathscr{B} \neq \mathscr{B} \mathscr{A}, \quad \text { 但 } \mathscr{A}^{2} \mathscr{B}^{2}=\mathscr{B}^{2} \mathscr{A}^{2}.
\]
并检验 $(\mathscr{A} \mathscr{B})^{2}=\mathscr{A}^{2} \mathscr{B}^{2}$ 是否成立。
\end{exercise}
\fi

\begin{exercise}\tiyuan{\cite[P219, 3]{PWS19}}
在 $P[x]$ 中， $\mathscr{A} f(x)=f^{\prime}(x), \mathscr{B} f(x)=x f(x)$, 证明：
\[
  \mathscr{A} \mathscr{B}-\mathscr{B A}=\mathscr{E}.
\]
\end{exercise}

\begin{solution}
  对$f\in P[x]$, 我们有
  \[
    (\sA\sB-\sB\sA)(f)=\sA\sB f-\sB \sA f= (xf)' - xf' = (f+xf')-xf'=f.
  \]
  因此$\sA\sB-\sB\sA=\sE$.
\end{solution}

\begin{remark}
  若$V$是有限维向量空间且$\dim V>0$，那么不存在$V$上的线性变换$\sA, \sB$使得
  $\sA\sB-\sB\sA=\sE$. 
  若此式成立，两边取迹得$0=\tr(\sA\sB-\sB\sA)=\tr \sE=\dim V$.
  矛盾了。
\end{remark}

\iffalse
\begin{exercise}
设 $\mathscr{A}, \mathscr{B}$ 是线性变换， 如果 $\mathscr{A} \mathscr{B}-\mathscr{L} \mathscr{A}=\mathscr{E}$, 证明：
\[
  \mathscr{A}^{k} \mathscr{B}-\mathscr{B} \mathscr{A} \mathscr{A}^{k}=k \mathscr{A A}^{k-1}, \quad k>1.
\]
\end{exercise}


\begin{exercise}
  证明： 可逆变换是双射。
\end{exercise}
\fi

\paragraph*{习题 7.3\quad 线性变换的矩阵}

\begin{exercise}\label{1CA}\tiyuan{\cite[P219, 6]{PWS19}}%\marked
设 $\varepsilon_{1}, \varepsilon_{2}, \cdots, \varepsilon_{n}$ 是线性空间 $V$ 的一组基， $\mathscr{A}$ 是 $V$ 上的线性变换， 证明： $\mathscr{A}$ 可逆当且仅当 $\mathscr{A} \varepsilon_{1}$, $\mathscr{A} \varepsilon_{2}, \cdots, \mathscr{A} \varepsilon_{n}$ 线性无关。
\end{exercise}

\begin{solution}
令$A$为线性变换$\sA$在基 $\varepsilon_{1}, \varepsilon_{2}, \cdots, \varepsilon_{n}$ 下的矩阵。
我们知道，$\mathscr{A} \varepsilon_{1}$, $\mathscr{A} \varepsilon_{2}, \cdots, \mathscr{A} \varepsilon_{n}$ 线性无关
当且仅当这些向量的坐标向量线性无关，亦即，$A$的列向量组线性无关，这反过来相当于$A$可逆。
又可逆的线性变换对应于可逆矩阵，即$\sA$可逆当且仅当$A$可逆。
因此 $\mathscr{A}$ 可逆当且仅当 $\mathscr{A} \varepsilon_{1}$, $\mathscr{A} \varepsilon_{2}, \cdots, \mathscr{A} \varepsilon_{n}$ 线性无关。
\end{solution}



\iffalse
\begin{exercise}
求下列线性变换在所指定基下的矩阵：
\begin{enumerate}
  \item 第 1 题 4) 中变换 $\mathscr{A}$ 在基 $ \varepsilon_{1}=(1,0,0),  \varepsilon_{2}=(0,1,0),  \varepsilon_{3}=(0,0,1)$ 下的矩阵;
  \item $\left[O ; \varepsilon_{1}, \varepsilon_{2}\right]$ 是平面上一直角坐标系， $\mathscr{A}$ 是平面上的向量对第一和第三象限角的平分线的垂直投影， $\mathscr{B}$ 是平面上的向量对 $\varepsilon_{2}$ 的垂直投影， 求 $\mathscr{A}, \mathscr{B}, \mathscr{A} \mathscr{B}$ 在基 $\varepsilon_{1}, \varepsilon_{2}$ 下的矩阵;

  \item 在空间 $P[x]_{n}$ 中，设变换 $\mathscr{A}$ 为 $f(x) \rightarrow f(x+1)-f(x)$, 求 $\mathscr{A}$ 在基
\[
 \varepsilon_{0}=1, \quad \varepsilon_{i}=\frac{x(x-1) \cdots(x-i+1)}{i !}, \quad i=1,2, \cdots, n-1
\]
下的矩阵;
\item  6 个函数
\[
\begin{array}{lll}
 \varepsilon_{1}=\mathrm{e}^{a x} \cos b x, & \varepsilon_{2}=\mathrm{e}^{a x} \sin b x, & \varepsilon_{3}=x \mathrm{e}^{a x} \cos b x \\
\varepsilon_{4}=x \mathrm{e}^{a x} \sin b x, & \varepsilon_{5}=\frac{1}{2} x^{2} \mathrm{e}^{a x} \cos b x, & \varepsilon_{6}=\frac{1}{2} x^{2} \mathrm{e}^{a x} \sin b x
\end{array}
\]
的所有实系数线性组合构成实数域上一个 $6$ 维线性空间，求微分变换 $\mathcal{D}$ 在基 $ \varepsilon_{i}(i=1,2, \cdots, 6)$ 下的矩阵;

  \item 已知 $P^{3}$ 中线性变换 $\mathscr{A}$ 在基 $ \eta_{1}=(-1,1,1),  \eta_{2}=(1,0,-1),  \eta_{3}=(0,1,1)$ 下的矩阵是
\[
\begin{pmatrix}
1 & 0 & 1 \\
1 & 1 & 0 \\
-1 & 2 & 1
\end{pmatrix}
\]
求 $\mathscr{A}$ 在基 $ \varepsilon_{1}=(1,0,0),  \varepsilon_{2}=(0,1,0),  \varepsilon_{3}=(0,0,1)$ 下的矩阵;

  \item 在 $P^{3}$ 中， $\mathscr{A}$ 定义如下：
\[
\left\{\begin{array} { l } 
{ \mathscr { A } \boldsymbol { \eta } _ { 1 } = ( - 5 , 0 , 3 ) , } \\
{ \mathscr { A } \boldsymbol { \eta } _ { 2 } = ( 0 , - 1 , 6 ) , } \\
{ \mathscr { A } \boldsymbol { \eta } _ { 3 } = ( - 5 , - 1 , 9 ) , }
\end{array} \quad \text { 其中 } \left\{\begin{array}{l}
 \eta_{1}=(-1,0,2), \\
 \eta_{2}=(0,1,1), \\
 \eta_{3}=(3,-1,0)
\end{array}\right.\right.
\]
求 $\mathscr{A}$ 在基 $ \varepsilon_{1}=(1,0,0),  \varepsilon_{2}=(0,1,0),  \varepsilon_{3}=(0,0,1)$ 下的矩阵;

  \item 同上，求 $\mathscr{A}$ 在 $ \eta_{1},  \eta_{2},  \eta_{3}$ 下的矩阵。
\end{enumerate}
\end{exercise}
\fi

\begin{exercise}\tiyuan{\cite[P219, 7]{PWS19}}
  求下列线性变换在所给基下的矩阵：
  \begin{enumerate}
      \setcounter{enumi}{2}
    \item 求线性变换$\sA\colon P[x]_n\rightarrow P[x]_n, f(x)\mapsto f(x+1)-f(x)$在 基 
      \[
        \varepsilon_0=1, \quad \varepsilon_i=\frac{x(x-1)\cdots(x-i+1)}{i!}, i=1,2,\cdots,n-1.
      \]
      下的矩阵。
      \setcounter{enumi}{4}
  \item 已知 $P^{3}$ 中线性变换 $\mathscr{A}\colon P^3\rightarrow P^3$ 在基 $ \eta_{1}=(-1,1,1),  \eta_{2}=(1,0,-1),  \eta_{3}=(0,1,1)$ 下的矩阵是
\[
\begin{pmatrix}
1 & 0 & 1 \\
1 & 1 & 0 \\
-1 & 2 & 1
\end{pmatrix}
\]
求 $\mathscr{A}$ 在基 $ \varepsilon_{1}=(1,0,0),  \varepsilon_{2}=(0,1,0),  \varepsilon_{3}=(0,0,1)$ 下的矩阵;


    \item 设线性变换$\sA\colon P^3\rightarrow P^3$满足
      \[
        \begin{cases}
          \sA\eta_1=(-5,0,3),\\
          \sA\eta_2=(0,-1,6),\\
          \sA\eta_3=(-5,-1,9);
        \end{cases}\qquad\text{其中~}
        \begin{cases}
          \eta_1=(-1,0,2),\\
          \eta_2=(0,1,1),\\
          \eta_3=(3,-1,0).
        \end{cases}
      \]
      求$\sA$在基$\varepsilon_1=(1,0,0), \varepsilon_2=(0,1,0), \varepsilon_3=(0,0,1)$下的矩阵。 
\end{enumerate}
\end{exercise}

\begin{solution}
  \begin{enumerate}
      \setcounter{enumi}{2}
    \item 我们有
      \[
        \begin{aligned}
          \sA(\varepsilon_i)&= \varepsilon_i(x+1)-\varepsilon_i(x)  \\
          &= \frac{(x+1)x\cdots (x+1-(i-1))}{i!} - \frac{x(x-1)\cdots(x-(i-1))}{i!}\quad (\text{当~} i\geqslant 1) \\
          &= \frac{x(x-1)\cdots(x-(i-2))}{(i-1)!} \quad (\text{当~} i\geqslant 2)\\
            &=  \varepsilon_{i-1},
          \end{aligned}
      \]
      上式在$i\geqslant 2$时成立；又
      \[
        \sA(\varepsilon_0) =0,\quad \sA(\varepsilon_1)=\sA(x)=1.
      \]
      这样$\sA$在基$\varepsilon_0,\cdots,\varepsilon_{n-1}$下的矩阵为
      \[
        \begin{pmatrix}
          0 & 1 \\
          & \ddots& \ddots \\
          & & \ddots& 1\\
          & & & 0
        \end{pmatrix}.
      \]
      \setcounter{enumi}{4}
    \item 记$\sA$在基$\eta_1,\eta_2,\eta_3$下的矩阵为$A$.
      从基$\varepsilon_1,\varepsilon_2,\varepsilon_3$到基$\eta_1,\eta_2,\eta_3$
      的过渡矩阵为
      \[
        Q=\begin{pmatrix}
          -1 & 1 & 0\\
          1 & 0 & 1\\
          1 & -1 & 1
        \end{pmatrix};
      \]
从基$\eta_1,\eta_2,\eta_3$到基$\varepsilon_1,\varepsilon_2,\varepsilon_3$
的过渡矩阵为$Q^{-1}$.
      因此$\sA$在基$\varepsilon_1,\varepsilon_2,\varepsilon_3$下的矩阵为
      \[
        (Q^{-1})^{-1}AQ^{-1}=QAQ^{-1}=  
        \begin{pmatrix}
          -1 & 1 & -2 \\
          2 & 2 & 0 \\
          3 & 0 & 2
        \end{pmatrix}.
      \]
    \item 向量组$(\eta_1, \eta_2, \eta_3)$和$(\sA \eta_1, \sA \eta_2, \sA\eta_3)$
      在基$(\varepsilon_1, \varepsilon_2, \varepsilon_3)$下的坐标向量拼成的矩阵分别为
      \[
        P=\begin{pmatrix}
          -5 & 0 & -4 \\
          0 & -1 & -1 \\
          3 & 6 & 9
        \end{pmatrix}, \quad
        Q=\begin{pmatrix}
          -1 & 0 & 3\\
          0 & 1 & -1 \\
          2 & 1 & 0
        \end{pmatrix}.
      \]
      设$\sA$在基$(\varepsilon_1, \varepsilon_2, \varepsilon_3)$下的矩阵为$A$, 即$\sA(\varepsilon_1,\varepsilon_2,\varepsilon_3)=(\varepsilon_1,\varepsilon_2,\varepsilon_3)A$, 那么
      \[
        (\varepsilon_1, \varepsilon_2, \varepsilon_3) Q =(\sA \eta_1, \sA \eta_2, \sA\eta_3) =\sA( \varepsilon_1, \varepsilon_2, \varepsilon_3) P = (\varepsilon_1, \varepsilon_2, \varepsilon_3) A P.
      \]
      故而$Q=AP, A=QP^{-1}$. 我们列化简$\begin{pmatrix}
        P \\ Q
      \end{pmatrix}$可知
      \[\tag*{\qedhere}
        A = \frac{1}{7} \begin{pmatrix}
          -5 & 20 & -20 \\
          -4 & -5 & -2 \\
          27 & 18 & 24
        \end{pmatrix}.
      \]
  \end{enumerate}
\end{solution}


\begin{exercise}\tiyuan{\cite[P219, 8]{PWS19}}
  在 $P^{2 \times 2}$ 中定义线性变换
\[
\begin{aligned}
& \mathscr{A}_{1}( X)=\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}  X, \quad \mathscr{A}_{2}( X)= X\begin{pmatrix}
a & b \\
c & d
\end{pmatrix} \\
& \mathscr{A}_{3}( X)=\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}  X\begin{pmatrix}
a & b \\
c & d
\end{pmatrix}
\end{aligned}
\]
求 $\mathscr{A}_{1}, \mathscr{A}_{2}, \mathscr{A}_{3}$ 在基 $ E_{11},  E_{12},  E_{21},  E_{22}$ 下的矩阵。
\end{exercise}


\begin{solution}
  容易计算得
      \begin{align*}
        \sA_1 e_{11} =   \begin{pmatrix}
          a & 0 \\ c& 0
        \end{pmatrix}, \quad
        \sA_1 e_{12} =   \begin{pmatrix}
          0 & a \\ 0 & c
        \end{pmatrix}, \quad
        \sA_1 e_{21} =   \begin{pmatrix}
          b &0 \\ d& 0
        \end{pmatrix}, \quad
        \sA_1 e_{22} =  \begin{pmatrix}
          0 & b\\ 0  & d
        \end{pmatrix}.
      \end{align*}
      这样
      \[
        \sA_1 (e_{11},e_{12}, e_{21}, e_{22}) = (e_{11},e_{12}, e_{21}, e_{22}) \begin{pmatrix}
          a & 0 & b & 0 \\
          0 & a & 0 & b\\
          c & 0 & d & 0\\
          0 & c& 0 &d 
        \end{pmatrix},
      \]
      即$\sA_1$在基 $(e_{11}, e_{12}, e_{21}, e_{22})$下的矩阵为
      \[
        A_1=\begin{pmatrix}
          a & 0 & b & 0 \\
          0 & a & 0 & b\\
          c & 0 & d & 0\\
          0 & c& 0 &d 
        \end{pmatrix}.
      \]
      类似地，可以算出$\sA_2$在基 $(e_{11}, e_{12}, e_{21}, e_{22})$下的矩阵为
      \[
        A_2=\begin{pmatrix}
          a & c & 0 & 0\\
          b & d & 0 & 0\\
          0 & 0 & a & c\\
          0 & 0& b & d
        \end{pmatrix}.
      \]
      注意到$\sA=\sA_1\sA_2$, 故$\sA$在基 $(e_{11}, e_{12}, e_{21}, e_{22})$下的矩阵为
      \[\tag*{\qedhere}
        A_1A_2=\begin{pmatrix}
          a E & b E \\
          c E & d E 
        \end{pmatrix} \begin{pmatrix}
          A^{\rT} \\ & A^{\rT}
        \end{pmatrix}=\begin{pmatrix}
          a A^{\rT} & b A^{\rT} \\
          c A^{\rT} & d A^{\rT}
        \end{pmatrix}=\begin{pmatrix}
          a^2 & ac & ba & bc \\
          ab & ad & b^2 & bd \\
          ca & c^2 & da & dc \\
          cb & cd & db & d^2
        \end{pmatrix}.
      \]
\end{solution}

\iffalse
\begin{exercise}
  设三维线性空间 $V$ 上的线性变换 $\mathscr{A}$ 在基 $\varepsilon_{1}, \varepsilon_{2}, \varepsilon_{3}$ 下的矩阵为
\[
   A=\begin{pmatrix}
    a_{11} & a_{12} & a_{13} \\
  a_{21} & a_{22} & a_{23} \\
a_{31} & a_{32} & a_{33}
\end{pmatrix}
\]
\begin{enumerate}
    \item 求 $\mathscr{A}$ 在基 $\varepsilon_{3}, \varepsilon_{2}, \varepsilon_{1}$ 下的矩阵;
\item 求 $\mathscr{A}$ 在基 $ \varepsilon_{1}, k  \varepsilon_{2},  \varepsilon_{3}$ 下的矩阵，其中 $k \in P$ 且 $k \neq 0$;

  \item 求 $\mathscr{A}$ 在基 $\varepsilon_{1}+\varepsilon_{2}, \varepsilon_{2}, \varepsilon_{3}$ 下的矩阵。
  \end{enumerate}
\end{exercise}
\fi

\begin{exercise}\label{0BA}
  设$V$是向量空间且$\symscr{A}\in \End(V)$是线性变换，
  $\xi\in V$满足$\symscr{A}^{n-1}(\xi)\neq 0, \symscr{A}^n(\xi)=0$. 
  \begin{enumerate}
    \item  \tiyuan{\cite[P219, 10]{PWS19}}
      证明$\xi, \symscr{A}(\xi), \cdots, \symscr{A}^{n-1}(\xi)$线性无关。
    \item \tiyuan{\cite[P219, 11]{PWS19}}
      求出 $\symscr{A}$在其不变子空间
  $W=L(\xi, \symscr{A}(\xi), \cdots, \symscr{A}^{n-1}(\xi))$上的限制得到的线性变换$\symscr{A}|_W$
  在基$(\xi, \symscr{A}(\xi), \cdots, \symscr{A}^{n-1}(\xi))$下的矩阵。
  \end{enumerate}
\end{exercise}

\begin{solution}
  \begin{enumerate}
    \item 显然$\symscr{A}^m\xi=0$, 对$m\geqslant n$. 
      令\[
        0=a_0 \xi+ a_1 \symscr{A} \xi+  \cdots + a_{n-1} \symscr{A}^{n-1} \xi, 
      \] 其中$a_j\in P$.
      为了证明$(\xi, \symscr{A}\xi, \cdots, \symscr{A}^{n-1}\xi)$的无关性，我们来证明所有的$a_j$都等于$0$. 
      用$\symscr{A}^{n-1}$作用在两边得
      \[
        0=a_0 \symscr{A}^{n-1} \xi+ a_1  \symscr{A}^{n} \xi + \cdots + a_{n-1}\symscr{A}^{2(n-1)} \xi=a_0 \symscr{A}^{n-1} \xi.
      \]
    由于$\symscr{A}^{n-1}\xi\neq 0$, 只有$a_0=0$.
    这时我们有$0=a_1 \symscr{A} \xi+  \cdots + a_n \symscr{A}^{n-1} \xi$.
    用$\symscr{A}^{n-2}$作用在两边得
    \[
      0=a_1\symscr{A}^{n-1} \xi+ \cdots + a_{n-1} \symscr{A}^{2n-3}=a_1\symscr{A}^{n-1} \xi.
    \]
    同样地，由于$\symscr{A}^{n-1}\xi\neq 0$, 只有$a_1=0$.
    类似地操作下去，我们依次可得$a_2=0, \cdots, a_{n-1}=0$.

 
    \item 显然
      \[
        \symscr{A}(\xi, \symscr{A}\xi, \cdots, \symscr{A}^{n-1}\xi) = (\symscr{A}\xi, \symscr{A}^2\xi, \cdots, \symscr{A}^{n}\xi)=  (\xi, \symscr{A}\xi, \cdots, \symscr{A}^{n-1}\xi)N,
      \]
      其中$N=\begin{pmatrix}
        0 \\
        1 & \ddots\\
        & \ddots & \ddots \\
        & & 1 & 0
      \end{pmatrix}$. 
      所以$\symscr{A}|_W$在基$(\xi, \symscr{A}\xi, \cdots, \symscr{A}^{n-1}\xi)$下的矩阵为$N$.
      \qedhere
  \end{enumerate}
\end{solution}

\begin{remark}
  第(1)小题可更严格地用数学归纳法描述如下。
      我们对$0\leqslant i\leqslant n-1$向下归纳来证明$\symscr{A}^i \xi, \cdots, \symscr{A}^{n-1} \xi$线性无关。
      若$i=n-1$, 由于$\symscr{A}^{n-1} \xi\neq 0$, $(\symscr{A}^{n-1} \xi)$线性无关。
      现在考虑$0\leqslant i<n-1$. 令
      \[\tag{$*$}
      0=a_i \symscr{A}^i \xi+ \cdots + a_{n-1} \symscr{A}^{n-1} \xi,
    \] 其中$a_j\in P$.
      用$\symscr{A}$作用后得
      \[
        0=a_i\symscr{A}^{i+1} \xi+ \cdots + a_{n-2}\symscr{A}^{n-1} \xi + a_{n-1}\symscr{A}^{n} \xi=a_i\symscr{A}^{i+1} \xi+ \cdots + a_{n-2}\symscr{A}^{n-1} \xi.
      \]
      由归纳假设，$(\symscr{A}^{i+1}\xi, \cdots, \symscr{A}^{n-1}\xi)$线性无关，故$a_{i}=\cdots=a_{n-2}=0$.
      进而($*$)变成了$0=a_{n-1} \symscr{A}^{n-1} \xi$. 而$\symscr{A}^{n-1} \xi\neq 0$, 只有$a_{n-1}=0$.
      这就证明了所有的$a_j=0$,
      故而$(\symscr{A}^{i}\xi, \cdots, \symscr{A}^{n-1}\xi)$线性无关，对任意的$0\leqslant i\leqslant n-1$.
\end{remark}

\iffalse
\begin{exercise}
  设 $\mathscr{A}$ 是线性空间 $V$ 上的线性变换， 如果 $\mathscr{A}^{k-1} \xi \neq 0$, 但 $\mathscr{A}^{k} \xi=0$, 求证 $ \xi, \mathscr{A} \xi, \cdots, \mathscr{A}^{k-1} \xi(k>0)$ 线性无关。
\end{exercise}

\begin{exercise}
在 $n$ 维线性空间中， 设有线性变换 $\mathscr{A}$ 与向量 $\xi$, 使得 $\mathscr{A}^{n-1} \xi \neq 0$, 但 $\mathscr{A}^{n} \xi=0$, 求证 $\mathscr{A}$ 在某组基下的矩阵是
\[
  \begin{pmatrix}
    0 & 0 & \cdots & 0 & 0 \\
  1 & 0 & \cdots & 0 & 0 \\
0 & 1 & \cdots & 0 & 0 \\
\vdots & \vdots & & \vdots & \vdots \\
0 & 0 & \cdots & 1 & 0
\end{pmatrix}
\]
\end{exercise}

\begin{exercise}
设 $V$ 是数域 $P$ 上 $n$ 维线性空间。 证明： $V$ 上的与全体线性变换可交换的线性变换是数乘变换。
\end{exercise}

\begin{exercise}
$\mathscr{A}$ 是数域 $P$ 上 $n$ 维线性空间 $V$ 的一个线性变换。证明： 如果 $\mathscr{A}$ 在任意一组基下的矩阵都相同，那么 $A$ 是数乘变换。
\end{exercise}
\fi

  \begin{exercise}\tiyuan{\cite[P219, 15]{PWS19}}
    给定 $P^{3}$ 的两组基
  \[
    \begin{array}{lll}
     \varepsilon_{1}=(1,0,1), &  \varepsilon_{2}=(2,1,0), &  \varepsilon_{3}=(1,1,1) \\
   \eta_{1}=(1,2,-1), &  \eta_{2}=(2,2,-1), &  \eta_{3}=(2,-1,-1)
\end{array}
\]
定义线性变换 $\mathscr{A}$ :
\[
\mathscr{A}  \varepsilon_{i}= \eta_{i}, \quad i=1,2,3
\]
\begin{enumerate}
  \item 写出由基 $ \varepsilon_{1},  \varepsilon_{2},  \varepsilon_{3}$ 到基 $ \eta_{1},  \eta_{2},  \eta_{3}$ 的过渡矩阵;

    \item 写出 $\mathscr{A}$ 在基 $\varepsilon_{1}, \varepsilon_{2}, \varepsilon_{3}$ 下的矩阵;

      \item 写出 $\mathscr{A}$ 在基 $ \eta_{1},  \eta_{2},  \eta_{3}$ 下的矩阵。
  \end{enumerate}
\end{exercise}


\begin{solution}
  \begin{enumerate}
    \item 自然基$\symbb{B}=(e_1,e_2,e_3)$到基$\symbb{B}_1=(\varepsilon_1,\varepsilon_2,\varepsilon_3)$的矩阵为$Q_1=\begin{pmatrix}
        \varepsilon_1^{\rT} & \varepsilon_2^{\rT} & \varepsilon_3^{\rT}
      \end{pmatrix}$, 
自然基$\symbb{B}=(e_1,e_2,e_3)$到基$\symbb{B}_2=(\eta_1,\eta_2,\eta_3)$的矩阵为$Q_2=\begin{pmatrix}
        \eta_1^{\rT} & \eta_2^{\rT} & \eta_3^{\rT}
      \end{pmatrix}$.
      由$\symbb{B}_1=\symbb{B} Q_1, \symbb{B}_2=\symbb{B} Q_2$知
      \[
        \symbb{B}_2=\symbb{B} Q_2=\symbb{B}_1 Q_1^{-1}Q_2.
      \]
      故基$\symbb{B}_1$到基$\symbb{B}_2$的过渡矩阵$A$为
      \[
        A=Q_1^{-1}Q_2=
        \begin{pmatrix}
-2 & -\frac{3}{2} & \frac{3}{2} \\
1 & \frac{3}{2} & \frac{3}{2} \\
1 & \frac{1}{2} & -\frac{5}{2}
        \end{pmatrix}.
      \]
    \item 我们有
      \[
        \sA(\symbb{B}_1)=\symbb{B}_2 = \symbb{B}_1 A
      \]
      因此$\sA$在基$\symbb{B}_1$下的矩阵正是$A$.
    \item 既然基$\symbb{B}_1$到基$\symbb{B}_2$的过渡矩阵为$A$, 且$\sA$在基$\symbb{B}_1$下的矩阵为$A$, 
      我们有$\sA$在基$\symbb{B}_2$下的矩阵为$A^{-1}A A=A$.
      \qedhere
  \end{enumerate}
\end{solution}

\iffalse
\begin{exercise}
  证明：
\[
  \begin{pmatrix}
    \lambda_{1} & & & \\
  & \lambda_{2} & & \\
& & \ddots & \\
& & & \lambda_{n}
\end{pmatrix} \text { 与 }\begin{pmatrix}
  \lambda_{i_{1}} & & & \\
& \lambda_{i_{2}} & & \\
& & \ddots & \\
& & & \lambda_{i_{n}}
\end{pmatrix}
\]
相似，其中 $i_{1} i_{2} \cdots i_{n}$ 是 $1,2, \cdots, n$ 的一个排列。
\end{exercise}

\begin{exercise} 
  如果 $ A$ 可逆，证明： $A B$ 与 $B A$ 相似。
\end{exercise}
\fi

\begin{exercise}\tiyuan{\cite[P219, 18]{PWS19}}
如果 $A$ 与 $B$ 相似， $C$ 与 $D$ 相似，证明：
\[
  \begin{pmatrix}
    A & \\
  & C
\end{pmatrix} \quad \text { 与 }\quad\begin{pmatrix}
  B & \\
& D
\end{pmatrix}
\]
相似。
\end{exercise}

\begin{solution}
  设可逆矩阵$S, T$使得$S^{-1}AS=B, T^{-1}CT=D$. 
  那么
  \[
    \begin{aligned}
    \begin{pmatrix}
      S \\ & T
    \end{pmatrix}^{-1}\begin{pmatrix}
      A \\ & C
    \end{pmatrix}\begin{pmatrix}
      S \\ & T
    \end{pmatrix} &= 
\begin{pmatrix}
  S^{-1} \\ & T^{-1}
    \end{pmatrix}\begin{pmatrix}
      A \\ & C
    \end{pmatrix}\begin{pmatrix}
      S \\ & T
    \end{pmatrix}  \\
    &=  \begin{pmatrix}
      S^{-1}AS \\ & T^{-1}CT
    \end{pmatrix}=\begin{pmatrix}
      B \\ & D
    \end{pmatrix}.
    \end{aligned}
  \]
  因此$\begin{pmatrix}
      A \\ & C
    \end{pmatrix}$与$\begin{pmatrix}
      B \\ & D
    \end{pmatrix}$相似。
\end{solution}



\paragraph*{习题 7.4\quad 特征值与特征向量}

\begin{exercise}
  设方阵$A$的特征多项式为$p(\lambda)=\lambda^5+\lambda^4+4\lambda^2+2\lambda+3$. 求$A$的行列式和迹。
\end{exercise}
\begin{solution}
    我们知道若$n$阶方阵$A$的特征多项式为
  $p(\lambda)=\lambda^n+a_{n-1}\lambda^{n-1} + \cdots  + a_1 \lambda + a_0$, 
  那么$\tr A=-a_{n-1}$, $|A|=(-1)^n a_0$. 
  这样$p(\lambda)=\lambda^5+\lambda^4+4\lambda^2+2\lambda+3$时$\tr A=-1, |A|=-3$.
\end{solution}


\begin{exercise}\label{221}
\begin{enumerate}
\item %\marked
 设$A=\begin{pmatrix}
-1 & -1 & 1 \\
a & 5 & -2 \\
2 & 1 & 2
\end{pmatrix}$
与$B=\begin{pmatrix}
    1 \\ & 2 \\ && 3
  \end{pmatrix}$相似。求$a$.

\item  %\marked
  设$A=\begin{pmatrix}
    a & -2 & 0 \\
    -2 & 1 & b \\
    0 & -2 & 0
  \end{pmatrix}$与$B=\begin{pmatrix}
    1 \\ & -2 \\ && 4
  \end{pmatrix}$相似。求$a, b$.
\end{enumerate}
\end{exercise}

\begin{solution}
  我们应用这样的事实：由于特征多项式为相似不变量，迹和行列式（相差个符号）作为其系数也是相似不变量。
\begin{enumerate}
\item  
 由$|A|=|B|$知$\begin{vmatrix}
-1 & -1 & 1 \\
a & 5 & -2 \\
2 & 1 & 2
  \end{vmatrix}=6$, 从而$a=8$.

\item 由$\tr A=\tr B$知$a+1=3$, 故$a=2$. 
  再由$|A|=|B|$知$\begin{vmatrix}
    2 & -2 & 0 \\
    -2 & 1 & b \\
    0 & -2 & 0
  \end{vmatrix}=-8$, 从而$b=-2$.
\qedhere
\end{enumerate}
\end{solution}

\begin{remark}
  实际上，若$n$阶方阵$A=(a_{ij})$的特征多项式为
  $p(\lambda)=\lambda^n + a_{n-1}\lambda^{n-1} + \cdots + a_1 \lambda + a_0$, 
  那么对$1\leqslant i\leqslant n$, $(-1)^ia_{n-i}$等于$A$的所有$i$阶主子式之和
  (练习 \ref{0CD})。
  特别地，$-a_{n-1}=\tr A$, $(-1)^n a_0=|A|$.
  所以$A$的所有$i$阶主子式之和都是相似不变量。
\end{remark}


\begin{exercise}\label{0CA}\tiyuan{\cite[P219, 19]{PWS19}}
  求复数域上线性空间 $V$ 的线性变换 $\mathscr{A}$ 的特征值与特征向量，已知 $\mathscr{A}$ 在一组基下的矩阵为：
  \begin{enumerate}
      %\item $A=\begin{pmatrix}3 & 4 \\ 5 & 2\end{pmatrix}$;
      \setcounter{enumi}{1}
        \item $ A=\begin{pmatrix}0 & a \\ -a & 0\end{pmatrix}$;
          \item $A=\begin{pmatrix}1 & 1 & 1 & 1 \\ 1 & 1 & -1 & -1 \\ 1 & -1 & 1 & -1 \\ 1 & -1 & -1 & 1\end{pmatrix}$;
            \item $ A=\begin{pmatrix}5 & 6 & -3 \\ -1 & 0 & 1 \\ 1 & 2 & -1\end{pmatrix}$;
      %\item $ A=\begin{pmatrix}0 & 0 & 1 \\ 0 & 1 & 0 \\ 1 & 0 & 0\end{pmatrix}$;
      \setcounter{enumi}{5}
        %\item $ A=\begin{pmatrix}0 & 2 & 1 \\ -2 & 0 & 3 \\ -1 & -3 & 0\end{pmatrix}$;
      %\item $ A=\begin{pmatrix}3 & 1 & 0 \\ -4 & -1 & 0 \\ 4 & -8 & -2\end{pmatrix}$.
\setcounter{enumi}{7}
\item\label{0CC} 
  $A=\begin{pmatrix}
          2 & -2 & 0 \\
          -2 & 1 & -2\\
          0 & -2 & 0
        \end{pmatrix}$.

  \end{enumerate}
\end{exercise}

\begin{solution} 记所给基为$\symbb{B}=(\varepsilon_1,\cdots,\varepsilon_n)$,
  其中$n$依具体问题确定。
  \begin{enumerate}
\setcounter{enumi}{1}
    \item $A$的特征多项式为
      \[
        \det (\lambda E-A)=\lambda^2+a^2=(\lambda+a\mathrm{i})(\lambda-a\mathrm{i}).
      \]
      若$a=0$, 所有特征值都是$0$, 所有非零的$2$维列向量都是$A$的特征向量，$V$中所有的非零向量都是$\sA$的属于特征值$0$的特征向量。
      若$a\neq 0$, 则$A$有两个特征值$\pm a\mathrm{i}$. 显然这两个特征值的几何重数都是$1$.
      要找特征向量，我们需要解线性方程组$(a\mathrm{i} E - A)X=0$和$(-a\mathrm{i}E-A)X=0$.
      分别把$a\mathrm{i} E - A$和$-a\mathrm{i} E-A$行化简至阶梯形得
      \[
        \begin{pmatrix}
          a\mathrm{i} & -a\\
          a & a\mathrm{i}
      \end{pmatrix}\rightarrow 
      \begin{pmatrix}
        \mathrm{i} & -1\\ 0 & 0
      \end{pmatrix},\quad 
      \begin{pmatrix}
        -a\mathrm{i} & -a \\ a & -a\mathrm{i}
      \end{pmatrix}\rightarrow 
      \begin{pmatrix}
        1 & -\mathrm{i} \\ 0 & 0
      \end{pmatrix}.
    \]
    这样分别可得$(a\mathrm{i}E-A)X=0$的一个基础解系$\alpha_1=(1,\mathrm{i})^{\rT}$和$(-a\mathrm{i}E -A)X=0$的一个基础解系$\alpha_2=(\mathrm{i},1)^{\rT}$.
    进而$A$的属于特征值$a\mathrm{i}$的所有的特征向量为$c\alpha_1$, 其中$0\neq c\in \bC$任意；
    $A$的属于特征值$-a\mathrm{i}$的所有的特征向量为$c\alpha_2$, 其中$0\neq c\in \bC$任意。
    因此
    $\sA$的属于特征值$a\mathrm{i}$的所有的特征向量为
    \[
      \symbb{B} (c\alpha_1)=c(\varepsilon_1+ \mathrm{i} \varepsilon_2), \quad \text{其中$ 0\neq c\in \bC$任意；}
    \]
    $\sA$的属于特征值$-a\mathrm{i}$的所有的特征向量为
    \[
      \symbb{B} (c\alpha_2)=c(\mathrm{i}\varepsilon_1+\varepsilon_2), \quad \text{其中$0\neq c\in \bC$任意。}
    \]
  \item $A$的特征多项式为
    \begin{align*}
      \det (\lambda E-A)&= \begin{vmatrix}
        \lambda-1 & -1 & -1 & -1 \\ 
        -1 & \lambda-1 & 1 & 1 \\ 
        -1 & 1 & \lambda-1 & 1 \\ 
        -1 & 1 & 1 & \lambda-1
      \end{vmatrix} =
      \begin{vmatrix}
        0 & \lambda-2 & \lambda-2 & \lambda(\lambda-2) \\ 
        0 & \lambda-2 & 0 & 2-\lambda \\ 
        0 & 0 & \lambda-2 & 2-\lambda \\ 
        -1 & 1 & 1 & \lambda-1
      \end{vmatrix} \\
      &= (\lambda-2)^3 \begin{vmatrix}
        0 & 1 & 1 & \lambda \\ 
        0 & 1 & 0 & -1 \\ 
        0 & 0 & 1 & -1\\ 
        -1 & 1 & 1 & \lambda-1
      \end{vmatrix} = (\lambda-2)^3 \begin{vmatrix}
        1 & 1 & \lambda \\ 
        1 & 0 & -1 \\ 
        0 & 1 & -1
      \end{vmatrix} \\
      &= (\lambda-2)^3(\lambda+2).
    \end{align*}
因此$A$的特征值为$2,2,2,-2$.
求解齐次线性方程组$(2E-A)X=0$可得它的一个基础解系
\[
  \alpha_1=(1,1,0,0)^{\rT},\quad \alpha_2=(1,0,1,0)^{\rT},\quad \alpha_3=(1,0,0,1)^{\rT},
\]
所以$\sA$的属于特征值$2$的所有的特征向量为
\[
  \symbb{B}(c_1\alpha_1+c_2\alpha_2+c_3\alpha_3)=c_1(\varepsilon_1+\varepsilon_2)+c_2(\varepsilon_1+\varepsilon_3)+c_3(\varepsilon_1+\varepsilon_4), \quad \text{其中$c_1,c_2,c_3\in \bC$不全为$0$;}
\]
求解齐次线性方程组$(-2E-A)X=0$可得它的一个基础解系
\[
  \alpha_4=(-1,1,1,1)^{\rT},
\]
所以$\sA$的属于特征值$-2$的所有的特征向量为
\[
  \symbb{B}(c\alpha_4)=c(-\varepsilon_1+\varepsilon_2+\varepsilon_3+\varepsilon_4),\quad \text{其中$0\neq c\in \bC$.}
\]

  \item $A$的特征多项式为
    \begin{align*}
      \det (\lambda E -A)&= \begin{vmatrix}
        \lambda-5 & -6& 3 \\
        1 & \lambda & -1 \\
        -1 & -2 & \lambda+1
      \end{vmatrix} 
      = \begin{vmatrix}
        \lambda-5 & -6 -\lambda(\lambda-5) & \lambda-2 \\
        1 & 0 & 0 \\
        -1 & -2 + \lambda& \lambda
      \end{vmatrix}\\
      &= (\lambda-2)(\lambda^2-2\lambda-2)  
      = (\lambda-2) ( \lambda-(1+\sqrt{3}))(\lambda-(1-\sqrt{3})).
    \end{align*}
    故所有的特征值为$2, 1+\sqrt{3}, 1-\sqrt{3}$, 相应的一个特征向量分别为
    \[
      \alpha_1=(-2,1,0)^{\rT},\quad \alpha_2=(6+3\sqrt{3}, -2-\sqrt{3}, 1)^{\rT}, \quad \alpha_3=(-4+3\sqrt{3}, 2-\sqrt{3}, 1)^{\rT}.
    \]
    $\sA$的属于特征值$2$的所有的特征向量为
    \[
      \symbb{B} (c\alpha_1)=c(-2\varepsilon_1+\varepsilon_2),\quad  \text{其中$0\neq c\in \bC$;}
    \]
    $\sA$的属于特征值$1+\sqrt{3}$的所有的特征向量为
    \[
      \symbb{B} (c\alpha_2)=c ((6+3\sqrt{3})\varepsilon_1-(2+\sqrt{3})\varepsilon_2+\varepsilon_3), \quad \text{其中$0\neq c\in \bC$;}
\]
    $\sA$的属于特征值$1-\sqrt{3}$的所有的特征向量为
    \[
      \symbb{B} (c\alpha_3)= c((-4+3\sqrt{3})\varepsilon_1+ (2-\sqrt{3})\varepsilon_2+\varepsilon_3),\quad \text{其中$0\neq c\in \bC$.}
    \]
\setcounter{enumi}{7}

\item $A$的特征多项式为
      \begin{align*}
        \det(\lambda E-A) &= \begin{vmatrix}
          \lambda-2 & 2 & 0\\
          2 & \lambda-1 & 2\\
          0 & 2 & \lambda
        \end{vmatrix}= (\lambda-2)\begin{vmatrix}
          \lambda-1 & 2 \\ 2 & \lambda
        \end{vmatrix} - 2 \begin{vmatrix}
          2 & 0 \\
          2 & \lambda
        \end{vmatrix}\\
        &= \lambda^3-3\lambda^2-6\lambda+8
        = (\lambda-4)(\lambda-1)(\lambda+2).
      \end{align*}
      所以$A$的特征值为$4, 1, -2$. 显然这三个特征值的几何重数都是$1$. 
      我们下面找到每个特征子空间的一组基。
      考虑齐次线性方程组$(4E-A)X=0$. 行化简系数矩阵可得：
      \[
        4E-A=\begin{pmatrix}
          2 & 2 & 0\\
          2 & 3 & 2\\
          0 & 2 &4
        \end{pmatrix}\longrightarrow \begin{pmatrix}
          2 & 2  & 0\\
          0 & 1 & 2\\
          0 & 2 & 4
        \end{pmatrix}\\
        \longrightarrow
        \begin{pmatrix}
          1 & 1  &0\\
          0 & 1 & 2\\
          0 & 0 & 0
        \end{pmatrix}.
      \]
      所以$(4E-A)X=0$与
      \[
        \left\{ 
          \begin{array}[]{rrrl}
            x_1 & +x_2 & & =0\\
            & x_2 & +2x_3 &=0
          \end{array}
        \right.
      \]
      同解。
      取$x_3=1$, 回代可解得$x_2=-2, x_1=2$. 
      这样我们得到了一个属于特征值$4$的特征向量$\alpha_1=(2,-2,1)^{\rT}$;
      属于特征值$1$的所有的特征向量为
      \[
        \symbb{B}(c\alpha_1)=c(2\varepsilon_1-2\varepsilon_2+\varepsilon_3),\quad  \text{其中$0\neq c\in \bC$.}
      \]
      接着考虑齐次线性方程组$(E-A)X=0$. 行化简系数矩阵可得：
      \[
        E-A=\begin{pmatrix}
          -1 & 2 & 0\\
          2 & 0 & 2\\
          0 & 2 & 1
        \end{pmatrix}\longrightarrow 
        \begin{pmatrix}
          -1 & 2 & 0\\
          0 & 4 & 2\\
          0 & 2 & 1
        \end{pmatrix}\longrightarrow 
        \begin{pmatrix}
          -1 & 2 & 0\\
          0 & 2 & 1\\
          0 & 0 & 0
        \end{pmatrix}.
      \]
      所以$(E-A)X=0$与
      \[
        \left\{ 
          \begin{array}[]{rrrl}
            -x_1 & +2x_2 & &=0\\
            & 2x_2 & +x_3 &= 0
          \end{array}
        \right.
      \]
      同解。
      取$x_3=-2$, 回代可解得$x_2=1, x_1=2$. 
      这样我们得到了一个属于特征值$1$的特征向量$\alpha_2=(2,1,-2)^{\rT}$;
      $\sA$的属于特征值$1$的所有的特征向量为
      \[
        \symbb{B}(c\alpha_2)=c(2\varepsilon_1+\varepsilon_2-2\varepsilon_3),\quad \text{其中$0\neq c\in \bC$.}
\]
      最后考虑齐次线性方程组$(-2E-A)X=0$. 行化简系数矩阵可得：
      \[
        -2E-A=\begin{pmatrix}
          -4 & 2 & 0\\
          2 & -3 & 2\\
          0 & 2 & -2
        \end{pmatrix}\longrightarrow
        \begin{pmatrix}
          2 & -3 & 2\\
          0 & 1  &-1 \\ 
          0 & 0 & 0
        \end{pmatrix}.
      \]
      所以$(-2E-A)X=0$与
      \[
        \left\{ 
          \begin{array}[]{rrrl}
            2x_1 & -3x_2 & +2x_3 &=  0\\
            & x_2 & -x_3&= 0
          \end{array}
        \right.
      \]
      同解。
      取$x_3=2$, 回代解得$x_2=2, x_1=1$.
      这样我们得到了一个属于特征值$-2$的特征向量$\alpha_3=(1,2,2)^{\rT}$;
$\sA$的属于特征值$-2$的所有的特征向量为
\[
  \symbb{B}(c\alpha_3)=c(\varepsilon_1+2\varepsilon_2+2\varepsilon_3), \quad \text{其中$0\neq c\in \bC$.}
  \tag*{\qedhere}
\]
  \end{enumerate}
\end{solution}

\begin{remark}
第(8)题中分解$\lambda^3-3\lambda^2-6\lambda+8$时，若试出一个整数根$1$后不想再试了，也可用$\lambda^3-3\lambda^2-6\lambda+8$除以$\lambda-1$得到商，然后分解商。这个可以用长除法做到，不过用综合除法写很明快：
  \[
       \begin{array}{rrrrrrrrr}
          \cline{3-6}
          1 & & 1 & -3 & -6 & 8\\
          & & & 1 &  -2  & -8  \\
           \cline{3-6}
           && 1 & -2 & -8 & 0
       \end{array}
  \]
  所以商是$\lambda^2-2\lambda-8=(\lambda-4)(\lambda+2)$.
\end{remark}


\iffalse
\begin{exercise}
  \begin{enumerate}
      \item 设 $\lambda_{1}, \lambda_{2}$ 是线性变换 $\mathscr{A}$ 的两个不同特征值， $\varepsilon_{1}, \varepsilon_{2}$ 是分别属于 $\lambda_{1}, \lambda_{2}$ 的特征向量， 证明： $\varepsilon_{1}+\varepsilon_{2}$ 不是 $\mathscr{A}$ 的特征向量;

        \item 证明： 如果线性空间 $V$ 的线性变换 $\mathscr{A}$ 以 $V$ 每个非零向量作为它的特征向量， 那么 $\mathscr{A}$ 是数乘变换。
    \end{enumerate}
  \end{exercise}
\fi 

\begin{exercise}%\marked
  设 $A\in P^{n\times n}$, $g(\lambda)\in P[\lambda]$与$A$ 的特征多项式 $p(\lambda)$ 互素。
    证明 $g(A)$ 可逆。
\end{exercise}

\begin{solution}
  若 $g(\lambda)$ 与 $p(\lambda)$ 互素，那么存在 $u(\lambda), v(\lambda)\in P[\lambda]$ 使得
    \[
      u(\lambda)p(\lambda)+v(\lambda)g(\lambda)=1. 
\]
    代入 $\lambda=A$ 得
    \[
      u(A)p(A)+v(A)g(A)=E.
    \]
    由Hamilton-Cayley定理知 $p(A)=0$. 这样 $v(A)g(A)=E$, 从而 $g(A)$ 可逆，且$g(A)^{-1}=v(A)$.
\end{solution}


\begin{exercise}\label{228}
  设$A\in P^{3\times 3}$的特征多项式为$f(x)=x^3+2x^2+2$, 证明$A^2+2A, A^2+2A+2E$可逆，并用$A$的多项式表出这两个的逆。
\end{exercise}

\begin{solution}
  由Hamilton-Cayley定理知$A^3+2A^2+2E=0$. 从而$\left( -\frac{1}{2}A \right) \left( (A^2+2A) \right)=E$, 
  因此$A^2+2A$可逆，且$(A^2+2A)^{-1}=-\frac{1}{2} A$.

  令$g(x)=x^2+2x+2$.
  辗转相除可知$(f,g)=1$, 且可找到B\'ezout等式$uf+vg=1$, 其中
  \[
    u=\frac{1}{10} x + \frac{3}{10},\quad 
    v=-\frac{1}{10} x^{2} - \frac{3}{10} x + \frac{1}{5}.
  \]
  因此
  \[
    E=u(A)f(A)+v(A)g(A)=v(A)g(A).
  \]
  这样
  \[\tag*{\qedhere}
    g(A)^{-1}=v(A)=-\frac{1}{10} A^{2} - \frac{3}{10} A + \frac{1}{5}E.
  \]
\end{solution}


\paragraph*{习题 7.5\quad 对角化}

\begin{exercise}\tiyuan{\cite[P219, 20]{PWS19}}
  在练习~\ref{0CA}~中哪些变换的矩阵可以在适当的基下化成对角形? 在可以化成对角形的情况，写出相应的基变换的过渡矩阵 $ T$,并验算 $ T^{-1}  A  T$.
\end{exercise}

\begin{solution}
  (2),(3),(4),(8)中的线性变换都可对角化，因为极大线性无关的特征向量的个数等于空间的维数。
\end{solution}

\begin{exercise}\tiyuan{\cite[P219, 21]{PWS19}}
  在 $P[x]_{n}$ ($n>1)$ 中， 求微分变换 $\mathscr{D}$ 的特征多项式，并证明 $\mathscr{D}$ 在任何一组基下的矩阵都不可能是对角矩阵。
\end{exercise}

\begin{solution}
  取$P[x]_n$的基$(1,x,x^2/2,\cdots,x^{n-1}/(n-1)!)$. 
  $\sD$在此基下的矩阵为
  \[
    \begin{pmatrix}
      0 & 1  & \\
      & \ddots & \ddots\\
      & & \ddots & 1\\
      & & & 0
    \end{pmatrix}.
  \]
  因此$\sD$的特征多项式为$\lambda^{n}$.
  $\sD$的特征值都是$0$ ($n$-重), 而$\ker \sD =P$, 特别地，$\Null \sD =1$. 既然特征值$0$的几何重数小于代数重数，$\sD$不能对角化。
\end{solution}

\begin{exercise}\tiyuan{\cite[P219, 23]{PWS19}}
  设 $\varepsilon_{1}, \varepsilon_{2}, \varepsilon_{3}, \varepsilon_{4}$ 是 4 维线性空间 $V$ 的一组基，线性变换 $\mathscr{A}$ 在这组基下的矩阵为
\[
A=\begin{pmatrix}
5 & -2 & -4 & 3 \\
3 & -1 & -3 & 2 \\
-3 & \frac{1}{2} & \frac{9}{2} & -\frac{5}{2} \\
-10 & 3 & 11 & -7
\end{pmatrix}
\]


\begin{enumerate}
\item 求 $\mathscr{A}$ 在基
\[
\begin{aligned}
&  \eta_{1}=\varepsilon_{1}+2 \varepsilon_{2}+\varepsilon_{3}+\varepsilon_{4} \\
&  \eta_{2}=2 \varepsilon_{1}+3 \varepsilon_{2}+\varepsilon_{3} \\
&  \eta_{3}=\varepsilon_{3} \\
&  \eta_{4}=\varepsilon_{4}
\end{aligned}
\]
下的矩阵;

  \item 求 $\mathscr{A}$ 的特征值与特征向量;

  \item 求一可逆矩阵 $T$,使 $T^{-1} A T$ 成对角形。
\end{enumerate}
\end{exercise}

\begin{solution}
  \begin{enumerate}
    \item 基$\symbb{B} =(\varepsilon_1, \varepsilon_2, \varepsilon_3, \varepsilon_4)$到基$\symbb{B} '=(\eta_1, \eta_2, \eta_3, \eta_4)$
      的基变换矩阵为
      \[
        P=\begin{pmatrix}
          1 & 2 & 0 & 0\\
          2 & 3 & 0  & 0\\
          1 & 1 & 1 &0\\
          1 & 0 & 0 & 1
        \end{pmatrix}.
      \]
      既然$\sA$在基$\symbb{B} $下的矩阵为$A$, 
      $\sA$在基$\symbb{B} '$下的矩阵为
      \[
        P^{-1}AP = \begin{pmatrix}
          0 & 0 & 6 & -5\\
          0 & 0 & -5 & 4\\
          0 & 0 & \frac{7}{2} & -\frac{3}{2} \\
          0 & 0& 5 & -2
        \end{pmatrix}.
      \]
    \item 记$B=P^{-1}AP$为$\sA$在基$\symbb{B} '$下的矩阵。看上去用$B$计算更轻松。
      我们有
      \[
        \det (\lambda E-B) = \lambda^2(\lambda-1)(\lambda-\frac{1}{2}).
      \]
      故所有特征值为$0, 0, 1,\frac{1}{2}$. 
      容易观察到$BX=0$有两个线性无关解
      \[
        \xi_1'=(1,0,0,0)^{\rT}, \quad \xi_2'=(0,1,0,0)^{\rT}.
      \]
      这是属于特征值$0$的线性无关的两个特征向量。
      我们接着找特征值$1, \frac{1}{2}$的特征向量，为此我们要找到$(E-B)X=0$和$(\frac{1}{2}E-B)X=0$的一个基础解系。
      我们行化简系数矩阵$E-B, \frac{1}{2} E-B$至阶梯形得
      \begin{align*}
        E-B=\begin{pmatrix}
        1 & 0 & -6 & 5\\
          0 & 1 & 5 & -4\\
          0 & 0 & -\frac{5}{2} & \frac{3}{2} \\
          0 & 0& -5 & 3
        \end{pmatrix}& \rightarrow 
        \begin{pmatrix}
          1 & 0 &-6 & 5\\
          0 & 1 & 5 & -4\\
          0 & 0 & -5 & 3\\
          0 & 0 & 0 & 0
        \end{pmatrix},\\
        \frac{1}{2} E-B = \begin{pmatrix}
          \frac{1}{2} & 0 & -6 & 5\\
          0  & \frac{1}{2} & 5 & -4 \\
          0 & 0 & -3 & \frac{3}{2} \\
          0 & 0 & -5 & -\frac{5}{2} 
        \end{pmatrix} & \rightarrow
        \begin{pmatrix}
          \frac{1}{2} & 0 & -6 & 5\\
          0 & \frac{1}{2}  & 5 & -4 \\
          0 & 0 & -1 & \frac{1}{2} \\
          0 & 0& 0& 0
        \end{pmatrix}.
      \end{align*}
      这样可得分别属于特征值$1, \frac{1}{2}$的特征向量
      \[
        \xi_3'=(-7, 5, 3,5)^{\rT}, \quad \xi_4'=(-8, 6, 1, 2)^{\rT}.
      \]
      作为$B$的特征向量，$\xi'_i$是$\sA$的线性无关的一些特征向量在基$\symbb{B} '$下的坐标向量。
      这些特征向量在$\symbb{B} $下的坐标向量为
      \[
        \begin{aligned}
          \xi_1&= P\xi_1'=(1,2,1,1)^{\rT},\\
          \xi_2&= P\xi_2'=(2,3,1,0)^{\rT},\\
          \xi_3&= P\xi_3' = (3,1,1,-2)^{\rT},\\
          \xi_4&= P\xi_4'=(4,2,-1,-6)^{\rT}.
        \end{aligned}
      \]
      所有属于特征值$0$的特征向量为
      \[
        \symbb{B} (k\xi_1+l\xi_2)=k(\varepsilon_1+2\varepsilon_2+\varepsilon_3+\varepsilon_4)+l(2\varepsilon_1+3\varepsilon_2+\varepsilon_3),\quad\text{其中$k, l$不全为$0$};
\]
      所有属于特征值$1$的特征向量为
      \[
        \symbb{B} (k\xi_3)=k(3\varepsilon_1+\varepsilon_2+\varepsilon_3-2\varepsilon_4),\quad \text{其中$k\neq 0$};
      \]
      所有属于特征值$\frac{1}{2}$的特征向量为
      \[
        \symbb{B} (k\xi_4)=k(4\varepsilon_1+2\varepsilon_2-\varepsilon_3+6\varepsilon_4),\quad \text{其中$k\neq 0$}.
      \]
    \item 由(2)知$Q^{-1}AQ=D,$ 其中
      \[\tag*{\qedhere}
        Q=\begin{pmatrix}
          \xi_1 & \xi_2 & \xi_3 & \xi_4
        \end{pmatrix}=\begin{pmatrix}
          1  & 2 & 3 & 4\\
          2 & 3 & 1 & 2\\
          1 & 1 & 1 & -1\\
          1 & 0 & -2 & -6
        \end{pmatrix},\quad
        D=\begin{pmatrix}
          0 \\ & 0 \\ & & 1 \\ &&& \frac{1}{2}
        \end{pmatrix} .
      \]
  \end{enumerate}
\end{solution}




\begin{exercise}\tiyuan{\cite[P219, 22]{PWS19}}
设
\[
   A=\begin{pmatrix}
    1 & 4 & 2 \\
  0 & -3 & 4 \\
0 & 4 & 3
\end{pmatrix}
\]
求 $ A^{k}$.
\end{exercise}

\begin{solution}
  先计算$A$的特征多项式：
  \[
    \det (\lambda E-A)=\begin{vmatrix}
          \lambda - 1 & -4 & -2 \\
  0 & \lambda+3 & -4 \\
0 & -4 & \lambda-3
    \end{vmatrix} = (\lambda-1)(\lambda-5)(\lambda+5).
  \]
  $A$的全部特征值为$1,5,-5$. 既然$A$的全部特征值互异，$A$可以对角化。
  可分别求得属于特征值$1,5,-5$的特征向量：
  \[
    \alpha_1=(1,0,0)^{\rT},\quad \alpha_2=(2,1,2)^{\rT},\quad \alpha_3=(1,-2,1)^{\rT}.
  \]
  令
  \[
    Q=\begin{pmatrix}
      \alpha_1 & \alpha_2 & \alpha_3
    \end{pmatrix}=\begin{pmatrix}
      1 & 2 & 1\\
      0 & 1 & -2 \\
      0 & 2 & 1
    \end{pmatrix}.
  \]
  那么$Q$是可逆矩阵，且有$AQ=QD$, 其中$D=\diag(1,5,-5)$. 
  进而$A=QDQ^{-1}$, 
    \begin{align*}
    A^k&= QD^k Q^{-1} = \begin{pmatrix}
      1 & 2 & 1\\
      0 & 1 & -2 \\
      0 & 2 & 1
    \end{pmatrix} \begin{pmatrix}
      1 \\ & 5^k \\ & & (-5)^k
    \end{pmatrix}\begin{pmatrix}
      1 & 2 & 1\\
      0 & 1 & -2 \\
      0 & 2 & 1
    \end{pmatrix}^{-1} \\
    &=  \begin{pmatrix}
1 & \frac{2}{5} \cdot 5^{k} - \frac{2}{5} \, \left(-5\right)^{k} & \frac{4}{5} \cdot 5^{k} + \frac{1}{5} \, \left(-5\right)^{k} - 1 \\
0 & \frac{1}{5} \cdot 5^{k} + \frac{4}{5} \, \left(-5\right)^{k} & \frac{2}{5} \cdot 5^{k} - \frac{2}{5} \, \left(-5\right)^{k} \\
0 & \frac{2}{5} \cdot 5^{k} - \frac{2}{5} \, \left(-5\right)^{k} & \frac{4}{5} \cdot 5^{k} + \frac{1}{5} \, \left(-5\right)^{k}
    \end{pmatrix}.
\tag*{\qedhere}
    \end{align*}
\end{solution}



\begin{exercise} 
  设$4$阶矩阵$A, B$相似，$A$的特征值为$1,\frac{1}{2},\frac{1}{3},\frac{1}{6}$. 求行列式$|B^{-1}-4E|$. 
\end{exercise}

\begin{solution}
  \iffalse
  $A$有$4$个不同的特征值，故$A$可相似对角化为$\diag(1,\frac{1}{2}, \frac{1}{3},\frac{1}{6})$.
  $B$与$A$相似，故亦可对角化为$\diag(1,\frac{1}{2}, \frac{1}{3},\frac{1}{6})$. 
  这样，存在可逆矩阵$P$使得$P^{-1}BP=\diag(1,\frac{1}{2}, \frac{1}{3},\frac{1}{6})$.
  （实际上$P$由$B$的属于特征值$1, \frac{1}{2}, \frac{1}{3}, \frac{1}{6}$的特征向量拼成的。）
  从而$P^{-1}B^{-1}P=\diag(1, 2, 3, 6)$, 进而
  \begin{align*}
    |B^{-1}-4E|= \lvert P^{-1}\rvert \lvert B^{-1}-4E\rvert \lvert P\rvert
    = \lvert P^{-1}BP-4E\rvert 
    = \begin{vmatrix}
      -3 \\ & -2 \\ && 1 \\ &&& 2 
    \end{vmatrix}
    = -12.
  \end{align*}
\fi
既然$A, B$相似，$B$跟$A$有相同的特征值，所以$B$的$4$个特征值为$1,\frac{1}{2},\frac{1}{3},\frac{1}{6}$.
进而$B^{-1}$的$4$个特征值为$1, 2, 3, 6$,
$B^{-1}-4E$的$4$个特征值为$-3,-2,-1,2$.
由此可知$|B^{-1}-4E|=(-3)\times(-2)\times(-1)\times 2=-12$.
\end{solution}

\begin{remark}
  \begin{enumerate}
    \item 若$A\in P^{n\times n}$有$n$个特征值$\lambda_1,\cdots, \lambda_n$ (按重数计入), 
    那么
    \begin{enumerate}[(i)]
      \item  $A^k$（其中$k$为正整数）有$n$个特征值$\lambda_1^k,\cdots,\lambda_n^k$.
更一般地，对$f(\lambda)\in P[\lambda]$, $f(A)$有$n$个特征值
        $f(\lambda_1), \cdots, f(\lambda_n)$.
      \item 若$A$可逆，则$A^{-1}$有$n$个特征值$\lambda_1^{-1}, \cdots, \lambda_n^{-1}$.
    \end{enumerate}

\item 
  若$A$是$n$阶可逆矩阵且其特征多项式为$p(\lambda)=\lambda^n+a_{n-1}\lambda^{n-1}+\cdots+a_1\lambda +a_0$，
  则$A^{-1}$的特征多项式为
  \[
    f(\lambda)=\frac{1}{a_0}+\frac{a_{n-1}}{a_0} \lambda + \cdots + \frac{a_1}{a_0}\lambda^{n-1}+\lambda^n.
  \]
  实际上，
  \begin{align*}
    f(\lambda)=|\lambda E-A^{-1}|
    &= |(-\lambda) (\lambda^{-1}E-A) A^{-1}|\\
    &= (-\lambda)^n |\lambda^{-1}E-A||A^{-1}|\\
    &= \frac{1}{(-1)^n|A|}\lambda^n p(\lambda^{-1})\\
    &= \frac{1}{a_0}+\frac{a_{n-1}}{a_0} \lambda + \cdots + \frac{a_1}{a_0}\lambda^{n-1}+\lambda^n.
  \end{align*}
  特别地，若$p(\lambda)$的$n$个根为$\lambda_1, \cdots, \lambda_n$（比如基域是复数域时）， 
  则$f(\lambda)$的$n$个根为$\frac{1}{\lambda_1}, \cdots, \frac{1}{\lambda_n}$.
  \end{enumerate}
\end{remark}

\begin{exercise}\label{21C}
  设实数列$\{x_n\}, \{y_n\}$满足
  $\begin{cases}
    x_n = 2x_{n-1}+y_{n-1}\\
    y_n = 2x_{n-1}+3y_{n-1}
  \end{cases}$, 且$x_0=1, y_0=1$. 求$\{x_n\}, \{y_n\}$的通项公式。
\end{exercise}


\begin{solution}
%  下面的两个方法是为了展示矩阵理论的应用。更直接的方法是令  $a_n=x_n+y_n$, 
 % $b_n=x_n-y_n$, 那么 $a_n =4a_{n-1}, b_n=-a_{n-1}+b_{n-1}$,
  %进而 容易得到 $\{a_n\}, \{b_n\}$的通项公式再求出$\{x_n\}, \{y_n\}$的通项公式。 
我们有
  \begin{align*}
    \begin{pmatrix}
      x_n \\
      y_n
    \end{pmatrix}= \begin{pmatrix}
      2 & 1 \\ 2 & 3
    \end{pmatrix} \begin{pmatrix}
      x_{n-1}\\ y_{n-1}
    \end{pmatrix} = 
    \begin{pmatrix}
      2 & 1 \\ 2 & 3
    \end{pmatrix}^2 \begin{pmatrix}
      x_{n-2} \\ y_{n-2} 
    \end{pmatrix} = \cdots =
    \begin{pmatrix}
      2 & 1 \\ 2& 3
    \end{pmatrix}^n \begin{pmatrix}
      x_0 \\ y_0
    \end{pmatrix}.
  \end{align*}
  记$A=\begin{pmatrix}
    2 & 1 \\ 2 & 3
  \end{pmatrix}$, 我们需要计算$A^n$. 
  
  \fangfa  我们借助$A$的Jordan标准型计算。
  简单的情形是$A$可相似对角化，这里的情形便是如此。
  $A$的特征多项式为$|\lambda E-A|=(\lambda-4)(\lambda-1)$, 所以$A$的特征值为$4$, $1$.
  由于
  \[
    4E-A=\begin{pmatrix}
      2 & -1 \\ -2 & 1
    \end{pmatrix}\xrightarrow{r_2-r_1} \begin{pmatrix}
      2 & -1 \\ 0 & 0
    \end{pmatrix},
  \]
  $(4E-A)X=0$与$2x_1-x_2=0$同解；
  我们取$x_2=2$, 可解得$x_1=1$, 故$\xi_1=(1,2)^{\rT}$为$A$的属于特征值$4$的特征向量。
  由于
  \[
    E-A=\begin{pmatrix}
      -1 & -1 \\ -2 & -2 
    \end{pmatrix}\xrightarrow[r_2+2r_1]{r_1\times (-1)}
    \begin{pmatrix}
      1 & 1 \\ 0 & 0
    \end{pmatrix},
  \]
  $(E-A)X=0$与$x_1+x_2=0$同解；
  我们取$x_2=-1$, 可解得$x_1=1$, 故$\xi_2=(1,-1)^{\rT}$为$A$的属于特征值$1$的特征向量。
  令$P=\begin{pmatrix}
    \xi_1 & \xi_2
  \end{pmatrix}=\begin{pmatrix}
    1 & 1\\2 & -1
  \end{pmatrix}$, 则有
  $AP=P\begin{pmatrix}
    4 \\ & 1
  \end{pmatrix}$, 即
  $A=P\begin{pmatrix}
    4 \\ & 1
  \end{pmatrix}P^{-1}$. 
  这样
  \begin{align*}
    \begin{pmatrix}
      x_n\\y_n
    \end{pmatrix}&= A^n\begin{pmatrix}
    x_0 \\ y_0
    \end{pmatrix}= P\begin{pmatrix}
    4^n \\ & 1
  \end{pmatrix}P^{-1}\begin{pmatrix}
    1 \\ 1
  \end{pmatrix} \\
  &= \begin{pmatrix}
    1 & 1\\2 & -1
  \end{pmatrix} \begin{pmatrix}
    4^n \\ & 1
  \end{pmatrix} \cdot \left( -\frac{1}{3} \right) \begin{pmatrix}
    -1 & -1 \\ -2 & 1
  \end{pmatrix} \begin{pmatrix}
    1 \\ 1
  \end{pmatrix} \\
  &= -\frac{1}{3}\begin{pmatrix}
    4^n & 1\\2\cdot 4^n & -1
  \end{pmatrix} \begin{pmatrix}
    -2 \\-1
  \end{pmatrix}=\begin{pmatrix}
    \frac{2\cdot 4^n+1}{3} \\ \frac{ 4^{n+1}-1}{3}
  \end{pmatrix}.
\end{align*}
所以$x_n=\frac{2\cdot 4^n+1}{3}$, $y_n= \frac{ 4^{n+1}-1}{3}$.

\fangfa  我们利用Hamilton-Cayley定理。
$A$的特征多项式为
\[
  p(\lambda)=|\lambda E-A|=(\lambda-4)(\lambda-1).
\]
令$\lambda^n$对$p(\lambda)=(\lambda-4)(\lambda-1)$的带余除法为
\[
  \lambda^n=(\lambda-4)(\lambda-1) q(\lambda)+r(\lambda),
\]
其中$r(\lambda)=0$或$\partial r(\lambda)<2$.
代入$\lambda=4, 1$可得$r(4)=4^n,r(1)=1$. 由Lagrange插值公式可知
\[
  r(\lambda)=\frac{\lambda-1}{4-1}r(4)+\frac{\lambda-4}{1-4}r(1)=\frac{1}{3}\left( (4^n-1)\lambda-4^n+4 \right).
\]
这样
\[
  \lambda^n = (\lambda-4)(\lambda-1) q(\lambda) +\frac{1}{3}\left( (4^n-1)\lambda-4^n+4 \right).
\]
代入$\lambda=A$再利用$p(A)=0$可得
\[
  A^n=\frac{1}{3}\left( (4^n-1)A-(4^n-4)E \right)=\frac{1}{3} \begin{pmatrix}
4^{n} + 2 &  4^{n} - 1 \\
2\cdot 4^{n} - 2 & 2\cdot 4^{n} + 1
  \end{pmatrix}.
\]
进而
\[
\begin{pmatrix}
      x_n\\y_n
    \end{pmatrix} = A^n\begin{pmatrix}
    x_0 \\ y_0
    \end{pmatrix} = \begin{pmatrix}
    \frac{2\cdot 4^n+1}{3} \\ \frac{ 4^{n+1}-1}{3}
  \end{pmatrix}.
\]
所以$x_n=\frac{2\cdot 4^n+1}{3}$, $y_n= \frac{ 4^{n+1}-1}{3}$.
\end{solution}




\paragraph*{习题 7.6\quad 线性映射的值域与核}

\begin{exercise}
  设$\varepsilon_1, \varepsilon_2, \varepsilon_3$是$3$维线性空间$V$的一组基，
$V$上的线性变换$\sA$在该基下的矩阵为 $A$, 
分别求$\sA$的核和值域的一组基，其中
\begin{enumerate}
  \item %\marked
 $A=\begin{pmatrix}
      1 & 1 & 2 \\
      1 & 2 & 3 \\
      0 & 1 & 1
    \end{pmatrix}.$
  \item %\marked
    $A=\begin{pmatrix}
1 & 0 & 2 \\
-1 & 2 & 1 \\
0 & 2 & 3
\end{pmatrix}.$
\end{enumerate}
\end{exercise}

\begin{solution}
  \begin{enumerate}
    \item     行化简$A$至阶梯形可得：
  \[
    \begin{pmatrix}
1 & 1 & 2 \\
1 & 2 & 3 \\
0 & 1 & 1
      \end{pmatrix}\rightarrow 
      \begin{pmatrix}
        1 & 0 & 1\\
        0 & 1 & 1 \\
        0 & 0 & 0
      \end{pmatrix}.
  \]
  由$A$化简到的阶梯形可知齐次线性方程组$AX=0$的一个基础解系为
  $\alpha=(-1,-1,1)^{\rT}$. 因此
$\sA$的核  $\sA^{-1}(\symbf{0})$的一组基为 $-\varepsilon_1-\varepsilon_2+\varepsilon_3$.
      又由$A$的化简结果知$\sA$的第$1,2$列$\alpha_1=(1,1,0)^{\rT}$, $\alpha_2=(1,2,1)^{\rT}$构成$A$的列的极大线性无关组。
因此$\sA$的值域的一组基为$\varepsilon_1+\varepsilon_2, \varepsilon_1+2\varepsilon_2+\varepsilon_3$.
\item   行化简$A$至阶梯形可得：
  \[
    \begin{pmatrix}
        1 & 0 & 2 \\
        -1 & 2 & 1 \\
        0 & 2 & 3
      \end{pmatrix}\xrightarrow{r_2+r_1} \begin{pmatrix}
        1 & 0 & 2 \\
        0 & 2 & 3 \\
        0 & 2 & 3
      \end{pmatrix}\xrightarrow{r_3-r_2} 
      \begin{pmatrix}
        1 & 0 & 2 \\
        0 & 2 & 3 \\
        0 & 0 & 0
      \end{pmatrix}.
  \]
  由$A$化简到的阶梯形可知齐次线性方程组$AX=0$的一个基础解系为
  $\alpha=(-2,-\frac{3}{2},1)^{\rT}$. 因此
$\sA$的核  $\sA^{-1}(\symbf{0})$的一组基为 $-2\varepsilon_1-\frac{3}{2}\varepsilon_2+\varepsilon_3$.
      又由$A$的化简结果知$\sA$的第$1,2$列$\alpha_1=(1,-1,0)^{\rT}$, $\alpha_2=(0,2,2)^{\rT}$构成$A$的列的极大线性无关组。
因此$\sA$的值域的一组基为$\varepsilon_1-\varepsilon_2, 2\varepsilon_2+2\varepsilon_3$.
\qedhere
  \end{enumerate}
\end{solution}


\begin{exercise}\tiyuan{\cite[P219, 14]{PWS19}} 
  设 $\varepsilon_{1}, \varepsilon_{2}, \varepsilon_{3}, \varepsilon_{4}$ 是 $4$ 维线性空间 $V$ 的一组基，已知线性变换 $\mathscr{A}$ 在这组基下的矩阵为
\[
  \begin{pmatrix}
    1 & 0 & 2 & 1 \\
  -1 & 2 & 1 & 3 \\
1 & 2 & 5 & 5 \\
2 & -2 & 1 & -2
\end{pmatrix}
\]
\begin{enumerate}
    \item 求 $\mathscr{A}$ 在基 $ \eta_{1}= \varepsilon_{1}-2 \varepsilon_{2}+ \varepsilon_{4},  \eta_{2}=3  \varepsilon_{2}- \varepsilon_{3}- \varepsilon_{4},  \eta_{3}= \varepsilon_{3}+ \varepsilon_{4},  \eta_{4}=2  \varepsilon_{4}$ 下的矩阵;

      \item 求 $\mathscr{A}$ 的核与值域;
        \item 在 $\mathscr{A}$ 的核中选一组基，把它扩充成 $V$ 的一组基，并求 $\mathscr{A}$ 在这组基下的矩阵;

        \item 在 $\mathscr{A}$ 的值域中选一组基，把它扩充成 $V$ 的一组基，并求 $\mathscr{A}$ 在这组基下的矩阵。
    \end{enumerate}
  \end{exercise}

\begin{solution}
记$\sA$在基$\symbb{B}=(\varepsilon_1,\varepsilon_2,\varepsilon_3,\varepsilon_4)$的矩阵为$A$.
  为了(2),(3),(4)的需要，我们把$A$行化简至阶梯形：
      \[
        A=\begin{pmatrix}
              1 & 0 & 2 & 1 \\
  -1 & 2 & 1 & 3 \\
1 & 2 & 5 & 5 \\
2 & -2 & 1 & -2
        \end{pmatrix}\xrightarrow{r_2+r_1,r_3-r_1,r_4-2r_1}\xrightarrow{\cdots}
        \begin{pmatrix}
          1 & 0 & 2 & 1\\
          0 & 2 & 3 & 4\\
          0 & 0 & 0 & 0 \\
          0 & 0 & 0 & 0
        \end{pmatrix}.
      \]

  \begin{enumerate}
  \item 基$\symbb{B}=(\varepsilon_1,\varepsilon_2,\varepsilon_3,\varepsilon_4)$到基$\symbb{B}_1=(\eta_1,\eta_2,\eta_3,\eta_4)$的过渡矩阵为
      \[
        Q=\begin{pmatrix}
          1 & 0 & 0  & 0\\
          -2 &  3 & 0 & 0 \\
          0 & -1 & 1 & 0\\
          1 & -1 & 1 & 2
        \end{pmatrix}.
      \]
      故$\sA$在基$\symbb{B}_1$下的矩阵为
      \[
        Q^{-1}AQ=
        \begin{pmatrix}
2 & -3 & 3 & 2 \\
\frac{2}{3} & -\frac{4}{3} & \frac{10}{3} & \frac{10}{3} \\
\frac{8}{3} & -\frac{16}{3} & \frac{40}{3} & \frac{40}{3} \\
0 & 1 & -7 & -8
        \end{pmatrix}.
      \]
    \item $\sA$的核和值域分别为
      \[
        \ker \sA=\{\symbb{B} X\mid, X\in P^{(4)}, AX=0\},\quad \im\sA=\{\symbb{B} X\mid X\in \Span_c(A)\}.
      \]
      由化简所得的$A$的阶梯形易知$AX=0$的一个基础解系为
      \[
        X_1=(4,3,-2,0)^{\rT},\quad 
        X_2=(-1,-2,0,1)^{\rT}.
      \]
      所以$\ker \sA$的一组基为$\symbb{B} X_1, \symbb{B} X_2$,
      且$\ker \sA = L(\symbb{B} X_1, \symbb{B} X_2)$.
      %\[
       % \begin{aligned}
        %  \ker \sA&= \{c_1 \symbb{B}\alpha+c_2\symbb{B}\alpha_2\mid c_i\in P\}.
        %&=  \{(4c_1-c_2)\varepsilon_1+(3c_1-2c_2)\varepsilon_2-2c_1\varepsilon_3+c_2\varepsilon_4\mid c_1,c_2\in P\}.
        %\end{aligned}
%\]
又由化简所得的$A$的阶梯形可知$A$的第$1,2$列$A_1,A_2$构成$A$的列向量组的一个极大线性无关组，
从而$\im \sA $的一组基为$\symbb{B}A_1, \symbb{B}A_2$, 且
$\im \sA=L(\symbb{B} A_1, \symbb{B} A_2)$.
%\[
%\begin{aligned}
%  \im \sA &=  \{c_1\symbb{B}A_1+c_2\symbb{B} A_2\mid c_i\in P\}. 
  %&= \{c_1\varepsilon_1+(-c_1+2c_2)\varepsilon_2+(c_1+2c_2)\varepsilon_3+(2c_1-2c_2)\varepsilon_4\mid c_1,c_2\in P\}.
%\end{aligned}
%\]
\item   令
  \[
    S=\begin{pmatrix}
      e_1 & e_2 & X_1 & X_2
    \end{pmatrix}= 
    \begin{pmatrix}
      1 & 0 & 4 & -1 \\
      0 & 1 & 3 & -2 \\
      0 & 0 & -2 & 0\\
      0 & 0 & 0 & 1
    \end{pmatrix}.
  \]
  这是个可逆矩阵，因此 $\symbb{B}_2= \symbb{B}S=(\varepsilon_1,\varepsilon_2,\symbb{B}X_1,\symbb{B}X_2)$ 为一组基。
  $\sA$在基$\symbb{B}_2$下的矩阵为
  \[
    S^{-1} A S=\begin{pmatrix}
5 & 2 & 0 & 0 \\
\frac{9}{2} & 1 & 0 & 0 \\
-\frac{1}{2} & -1 & 0 & 0 \\
2 & -2 & 0 & 0
    \end{pmatrix}.
  \]

  也可如下找到$\sA$在基$\symbb{B}_2$下的矩阵。
  注意到$\symbb{B}X_1, \symbb{B}X_2$是$\sA$的核中向量，
  其在$\sA$的像为$0$, 坐标是零向量；
  只用再确定 $\symbb{B}e_1= \varepsilon_1, \symbb{B}e_2=\varepsilon_2$的像的坐标。
  由
  \[
    \symbb{B}X_1=4\varepsilon_1+3\varepsilon_2-2\varepsilon_3,\quad
    \symbb{B}X_2=-\varepsilon_1-2\varepsilon_2+\varepsilon_4
  \]
  知
\[
  \varepsilon_3= \frac{1}{2}(4\varepsilon_1+3\varepsilon_2-\symbb{B}X_1),\quad
  \varepsilon_4= \varepsilon_1+2\varepsilon_2+\symbb{B}X_2.
\]
从而
\[
  \begin{aligned}
    \sA\varepsilon_1&= \varepsilon_1-\varepsilon_2+\varepsilon_3+2\varepsilon_4=
    5\varepsilon_1+\frac{9}{2}\varepsilon_2-\frac{1}{2}\symbb{B}X_1+2\symbb{B}X_2,\\
    \sA\varepsilon_2&= 2\varepsilon_2+2\varepsilon_3-2\varepsilon_4=
    2\varepsilon_1+\varepsilon_2-\symbb{B}X_1-2\symbb{B}X_2.
  \end{aligned}
\]
因此$\sA$在基$\symbb{B}_2=(\varepsilon_1,\varepsilon_2,\symbb{B}X_1,\symbb{B}X_2)$下的矩阵为
\[
\begin{pmatrix}
5 & 2 & 0 & 0 \\
\frac{9}{2} & 1 & 0 & 0 \\
-\frac{1}{2} & -1 & 0 & 0 \\
2 & -2 & 0 & 0
    \end{pmatrix}.
  \]
\item 只用把$A$的列的一个极大无关组$A_1, A_2$扩充为可逆矩阵$A'$即可。
显然
\[
  A'=\begin{pmatrix}
    A_1 & A_2 & e_3 & e_4
  \end{pmatrix}=\begin{pmatrix}
    1 & 0 & 0 & 0 \\
    -1 & 2 & 0 & 0 \\
    1 & 2 & 1 & 0\\
    2 & -2 & 0 & 1
  \end{pmatrix}
\]
就可以。
这样$\symbb{B}_3=\symbb{B} A'=(\symbb{B}A_1, \symbb{B}A_2, \varepsilon_3, \varepsilon_4)$就是$V$的一组基，
$\sA$在此基下的矩阵为
\[\tag*{\qedhere}
  A'^{-1}AA' = \begin{pmatrix}
5 & 2 & 2 & 1 \\
\frac{9}{2} & 1 & \frac{3}{2} & 2 \\
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0
  \end{pmatrix}.
\]
  \end{enumerate}
\end{solution}

\paragraph*{习题 7.7\quad 不变子空间}

\begin{exercise}\label{226}\tiyuan{\cite[P219, 25]{PWS19}}
    \label{07D}
  设 $V$ 是复数域上的 $n$ 维线性空间， $\mathscr{A}, \mathscr{B}$ 是 $V$ 上的线性变换， 且 $\mathscr{A} \mathscr{B}=\mathscr{B} \mathscr{A}$. 证明：
\begin{enumerate}
    \item 如果 $\lambda_{0}$ 是 $\mathscr{A}$ 的一特征值，那么 $V_{\lambda_{0}}$ 是 $\mathscr{B}$ 的不变子空间; 
      \item $\mathscr{A}, \mathscr{B}$ 至少有一个公共的特征向量。
  \end{enumerate}
\end{exercise}

\begin{solution}
  \begin{enumerate}
    \item 按定义$V_{\lambda_0}=\{\alpha\in V\mid \sA \alpha=\lambda_0 \alpha\}$.
      对$\alpha\in V_{\lambda_0}$, 
      \[
        \sA(\sB \alpha)=\sB(\sA \alpha)=\sB (\lambda_0 \alpha)=\lambda_0(\sB\alpha).
      \]
      这样$\sB \alpha\in V_{\lambda_0}$. 因此$V_{\lambda_0}$是$\sB$的不变子空间。
    \item \fangfa 
      由于$V_{\lambda_0}\neq \{0\}$, 且$\sB|_{V_{\lambda_0}}$的特征多项式有个复根$\lambda_1$,
      $\sB|_{V_{\lambda_0}}$相应地有个特征向量$\alpha\in V_{\lambda_0}$. 因此
\[
  \sB\alpha=\sB|_{V_{\lambda_0}}(\alpha)=\lambda_1\alpha,
\]
即$\alpha$是$\sB$的属于特征值 $\lambda_1$的特征向量。
又$\alpha\in V_{\lambda_0}$是$\sA$的属于特征值$\lambda_0$的特征向量，
因此$\alpha$为$\sA, \sB$的公共特征向量。

  \fangfa  设$v$是$\sA$的一个特征向量，特征值为$\lambda$.
  考虑$v$相对于$\sB$生成的循环子空间$\bC[\sB]v$. 
  这是$\sB$-子空间，故存在$\sB$的特征向量$w\in \bC[\sB]v$.
  由于$\sA\sB^{j}v=\lambda \sB^j v$, $\bC[\sB]v$中每个非零向量
  都是$\sA$的属于特征值$\lambda$的特征向量。
      \qedhere
  \end{enumerate}
\end{solution}



\paragraph*{习题 7.8\quad 若尔当 (Jordan) 标准形介绍}



\begin{exercise}\label{1EE}\tiyuan{\cite[P219, 26]{PWS19}}
  设 $V$ 是复数域上的 $n$ 维线性空间， 而线性变换 $\mathscr{A}$ 在基 $\varepsilon_{1}, \varepsilon_{2}, \cdots, \varepsilon_{n}$ 下的矩阵是一若尔当块。证明：
\begin{enumerate}
  \item $V$ 中包含 $\varepsilon_{1}$ 的 $\mathscr{A}$-子空间只有 $V$ 自身;
  \item %\marked
    $V$ 中任一非零 $\mathscr{A}$-子空间都包含 $\varepsilon_{n}$; 
  \item $V$ 不能分解成两个非平凡的 $\mathscr{A}$-子空间的直和。
\end{enumerate}
\end{exercise}

\begin{solution}
设
      \[
        \sA \begin{pmatrix}
          \varepsilon_1 & \cdots & \varepsilon_n
        \end{pmatrix} = \begin{pmatrix}
          \varepsilon_1 & \cdots & \varepsilon_n
        \end{pmatrix}A, \quad \text{其中~} A=\begin{pmatrix}
    \lambda_0 & \\
    1 & \ddots \\
    & \ddots & \ddots \\
    & & 1 & \lambda_0
  \end{pmatrix}.
      \]
    \begin{enumerate}
    \item 
      我们有
      \[
        \sA\varepsilon_1=\lambda_0\varepsilon_1+\varepsilon_2, \quad
        \sA\varepsilon_2=\lambda_0\varepsilon_2+\varepsilon_3,\quad 
        \cdots,\quad
        \sA \varepsilon_{n-1}=\lambda_0\varepsilon_{n-1}+\varepsilon_n,\quad
        \sA\varepsilon_n=\lambda_0 \varepsilon_n,
      \]
      从而
      \[
        \varepsilon_2=(\sA-\lambda_0\sE)\varepsilon_1, \quad 
        \varepsilon_3=(\sA-\lambda_0\sE) \varepsilon_2,\quad
        \cdots, \quad  
        \varepsilon_{n}=(\sA-\lambda_0\sE)\varepsilon_{n-1},\quad
        \sA \varepsilon_n= \lambda_0 \varepsilon_n .
      \]
      显然$\sA$-子空间$W$同时也是$(\sA-\lambda_0\sE)$-子空间。
      若$\varepsilon_1$属于$(\sA-\lambda_0\sE)$-子空间$W$, 
      容易对$i$归纳得$\varepsilon_i$ ($1\leqslant i\leqslant n$) 属于$W$.
      这样$W=V$.
    \item 设$W$为非零的$\sA$-子空间。
      $\sA|_W$的特征多项式有个复根$\lambda_1$, 这是$\sA|_W$的特征值， 
      且相应地有个特征向量$\alpha\in W$.
      这样
      \[
        \sA \alpha=\sA|_W(\alpha)=\lambda_1 \alpha.
      \]
      因此$\lambda_1$为$\sA$的一个特征值，$\alpha\in W$为相应的一个特征向量。
      而显然$\sA$的所有特征值都是$\lambda_0$, 因此$\lambda_1=\lambda_0$.
      求解齐次线性方程组$(\lambda_0E-A) X=0$可得一基础解系$\eta=(0,\cdots,0,1)^{\rT}$.
      这样$\sA$的全部 (属于特征值$\lambda_0$的) 特征向量为$k\varepsilon_n$, 其中$k\neq 0$.
      于是 $\alpha=k \varepsilon_n$ (对某个$k\neq 0$).
      $\alpha\in W$表明$\varepsilon_n\in W$.
    \item 由(2)知 $V$的两个非平凡的子空间都包含了$\varepsilon_n$, 故它们非线性无关，从而它们的和不是直和。
    \qedhere
  \end{enumerate}
\end{solution}



\paragraph*{习题 7.9\quad 最小多项式}

\begin{exercise}\tiyuan{\cite[P219, 27]{PWS19}}
  求下列矩阵的最小多项式：
  \twochoice{(1) $\begin{pmatrix}
                0 & 0 & 1\\
          0 & 1 & 0\\
          1 & 0 & 0
      \end{pmatrix}$.}
      {(2) $\begin{pmatrix}
          3 & -1 & -3 & 1\\
          -1 & 3 & 1 & -3 \\
          3 & -1 & -3 & 1 \\
          -1 & 3 & 1 & -3
      \end{pmatrix}$.}
\end{exercise}


\begin{solution}
  \begin{enumerate}
    \item 令$A=\begin{pmatrix}
          0 & 0 & 1\\
          0 & 1 & 0\\
          1 & 0 & 0
        \end{pmatrix}$.
        $A$的特征多项式为$(\lambda-1)^2(\lambda+1)$; 最小多项式整除特征多项式。
        由于最小多项式与特征多项式有相同的根集，我们可以从因子$(\lambda-1)(\lambda+1)$试起。
        易算得$(A-E)(A+E)=0$, 因此 $\lambda^2-1=(\lambda-1)(\lambda+1)$零化$A$.
        因此$A$的最小多项式为 $\lambda^2-1$.
      \item 令 $A=\begin{pmatrix}
          3 & -1 & -3 & 1\\
          -1 & 3 & 1 & -3 \\
          3 & -1 & -3 & 1 \\
          -1 & 3 & 1 & -3
        \end{pmatrix}$. 注意到$A$可分块为$\begin{pmatrix}
          B & -B \\ B & -B
        \end{pmatrix}$, 其中$B=\begin{pmatrix}
          3 & -1 \\ -1 & 3
        \end{pmatrix}$. 显然$A^2=0$. 因此$A$的最小多项式为 $\lambda^2$.
        \qedhere
  \end{enumerate}
\end{solution}

\begin{exercise}\label{1CD}
  设$A\in \bF^{n\times n}$, 且$A$的最小多项式为$m(\lambda)$. 证明
  \begin{enumerate}
    \item $A^{\rT}$最小多项式为$m(\lambda)$.
    \item $-A$的最小多项式为$(-1)^nm(-\lambda)$. 
    \item 若$A$可逆，$A^{-1}$的最小多项式为$\frac{1}{a_0} (\text{$m(\lambda)$的反多项式})$.
  关于特征多项式的类似结果见练习~\ref{050}。
  \end{enumerate}
\end{exercise}

\begin{proof}
  (1) 令$A^{\rT}$的最小多项式为$f(\lambda)$. 
      这样$f(A^{\rT})=0$. 转置可得$f(A)=0$, 所以$m\mid f$.
      由于$A=(A^{\rT})^{\rT}$, 我们也有$f\mid m$. 
      因此$m, f$相差个常数。又$m, f$首一，有$f=m$.

      (2) 设$-A$的最小多项式为$f(\lambda)$.
    这时$f(-A)=0$. 这样$m(\lambda) \mid f(-\lambda)$, 故$m(-\lambda)\mid f(\lambda)$. 
    由于$A=-(-A)$, 我们也有$f(\lambda)\mid m(-\lambda)$. 
    这样$f(\lambda)$与$m(-\lambda)$相差个常数。
    进而由首一性知 $f(\lambda)=(-1)^nm(-\lambda)$.

    (3) 
    设$\deg m=k$. 
    令$\hat{m}(\lambda)=\lambda^km(\frac{1}{\lambda})$为$m$的反多项式。 
  这样$\hat{m}(A^{-1})=A^k f(A)=0$. 
  令$g(x)=\frac{1}{a_0} \hat{m}$.
  那么$g$是零化$A^{-1}$的首一多项式，且$\deg g=\deg m=k$. 
  特别地，$A^{-1}$的最小多项式的次数小于等于$A$的最小多项式的次数。
  由于$A=(A^{-1})^{-1}$, 我们也有$A$的最小多项式的次数小于等于$A^{-1}$的最小多项式的次数。
  这样两个最小多项式次数相等。
  故而$g$就是$A^{-1}$的最小多项式。
\end{proof}



\iffalse
\begin{exercise}
  写出下列矩阵的最小多项式：

\noindent  (1)  $\begin{pmatrix}
          1 \\
          & 1 \\
          && 2 \\
        \end{pmatrix}$.
\hfill
(2)    $\begin{pmatrix}
          2 & -1 \\
          & 2\\
          & & -1
        \end{pmatrix}$.
\hfill
(3)    $\begin{pmatrix}
          0 & 1 & 0 \\
          0 & 0 & 1 \\
          3 & 2 & 1
        \end{pmatrix}$.
\hfill
(4)  $\begin{pmatrix}
                0 & 0 & 1\\
          0 & 1 & 0\\
          1 & 0 & 0
        \end{pmatrix}$.
\end{exercise}


\begin{solution}
  要计算$n$阶数字矩阵$A$的最小多项式，
  我们只用找到其特征矩阵$\lambda E-A$的标准形中最后一个不变因子$d_n(\lambda)$即可（比如化简特征矩阵，或者利用初等因子找不变因子，亦或者利用行列式因子找不变因子，等等），
  $d_n(\lambda)$就是$A$的最小多项式。
  除此之外，我们还有如下的事实可用：
  \begin{enumerate}[(i)]
    \item 准对角阵$\begin{pmatrix}
        A_1 \\ & A_2 \\ & &\ddots \\ &&& A_k
      \end{pmatrix}$的最小多项式$m$为这些$A_i$的最小多项式$m_i$的首一最小公倍，即$m=[m_1, \cdots, m_k]$.
    \item Jordan块$J(\lambda_0, k)$（对角线上是$\lambda_0$的$k$阶Jordan块）的最小多项式为$(\lambda-\lambda_0)^k$.
    \item 多项式$d(\lambda)=\lambda^n+a_{n-1} \lambda^{n-1} + \cdots + a_1 \lambda + a_0$的友矩阵
      \[
        \begin{pmatrix}
          0 & & & -a_0\\
          1 & \ddots & & \vdots\\
          & \ddots& 0 & -a_{n-2}\\
          & & 1 & -a_{n-1}
        \end{pmatrix}
      \]
      的最小多项式为$d(\lambda)$.
    \item 若$n$阶方阵$A$的最小多项式为$m(\lambda)$, 则$A^{\rT}$的最小多项式为$m(\lambda)$, $-A$的最小多项式为$(-1)^n m(-\lambda)$.
  \end{enumerate}
  \begin{enumerate}
      \item $\begin{pmatrix}
          1 \\
          & 1 \\
          && 2 \\
        \end{pmatrix}$的最小多项式为$(\lambda-1)(\lambda-2)$.

      \item $\begin{pmatrix}
          2 & -1 \\
          & 2\\
          & & -1
        \end{pmatrix}$的最小多项式为$(\lambda-2)^2(\lambda+1)$, 因为第一个二阶对角块$A'=\begin{pmatrix}
          2 & -1 \\
          & 2
        \end{pmatrix}$的最小多项式为$(\lambda-2)^2$, 第二个一阶对角块$-1$的最小多项式为$\lambda+1$. 
        要得到$A'$的最小多项式，\fangfa  显然$A'$的特征多项式为$(\lambda-2)^2$, 又$A'-2E\neq 0$, 故$A'$的最小多项式为$(\lambda-2)^2$. \fangfa  注意到$A'=-J(-2,2)^{\rT}$, 
        且Jordan块$J(-2,2)=\begin{pmatrix}
          -2 \\ 1 & -2
        \end{pmatrix}$的最小多项式为$(\lambda+2)^2$, 
        故$A'=-J(-2,2)^{\rT}$的最小多项式为$(-1)^2(-\lambda+2)^2=(\lambda-2)^2$; 
        \fangfa  我们也可以化简其特征矩阵至标准形得到：
        \[
          \begin{pmatrix}
            \lambda-2 & 1\\ & \lambda-2
          \end{pmatrix}\xrightarrow[r_2-r_1\times (\lambda-2)]{c_1-c_2\times (\lambda-2)} 
          \begin{pmatrix}
            0 & 1\\ -(\lambda-2)^2 & 0
          \end{pmatrix}\xrightarrow[c_2\times (-1)]{c_2\leftrightarrow c_2}
          \begin{pmatrix}
            1 \\ & (\lambda-2)^2
          \end{pmatrix}.
        \]
        所以$A'$的最小多项式为$(\lambda-2)^2$.
      \item $\begin{pmatrix}
          0 & 1 & 0 \\
          0 & 0 & 1 \\
          3 & 2 & 1
        \end{pmatrix}$的最小多项式为$d(\lambda)=\lambda^3-\lambda^2-2\lambda-3$, 因为所给矩阵为$d(\lambda)$的友矩阵的转置。
      \item 令$A=\begin{pmatrix}
          0 & 0 & 1\\
          0 & 1 & 0\\
          1 & 0 & 0
        \end{pmatrix}$.
      我们化简$\lambda E-A$来找$A$的最小多项式：
      \begin{align*}
        \lambda E-A=\begin{pmatrix}
          \lambda & 0 & -1\\
          0 & \lambda-1 & 0\\
          -1 & 0 & \lambda
        \end{pmatrix}\xrightarrow[r_1\leftrightarrow r_3]{r_1+r_3\times \lambda} 
        & 
        \begin{pmatrix}
          -1 & 0 & \lambda\\
          0 & \lambda-1 & 0\\
          0 & 0 & \lambda^2-1
        \end{pmatrix} \\
        \xrightarrow[r_1\times (-1)]{c_3+c_1\times \lambda} & 
        \begin{pmatrix}
          1 & 0 & 0\\
          0 & \lambda-1 & 0\\
          0 & 0 & \lambda^2-1
        \end{pmatrix}.
      \end{align*}
    最后的矩阵就是$\lambda E-A$的标准形，所以$\lambda^2-1$为$A$的最小多项式。
  \end{enumerate}
\end{solution}

\begin{remark}
  \begin{enumerate}
    \item 有因子分解时找首一最大公因子就是找到这些多项式的共同的首一不可约因子的最低次然后相乘，找首一最大公倍就是找到这些多项式的所有的首一不可约因子的最高次然后相乘。
  例如：考虑多项式
  \[
    f_1=(\lambda-1)^2(\lambda+2),\quad f_2= (\lambda-1)(\lambda+2),\quad f_3= (\lambda-1)(\lambda+2)^2(\lambda+3).
  \]
  $f_1, f_2, f_3$的首一最大公因子为 $(\lambda-1)(\lambda+2)$,
  因为$f_1, f_2, f_3$的公共首一不可约因子有$\lambda-1, \lambda+2$,  且在$f_1, f_2, f_3$中的出现的最低次数分别为$1, 1$; 
  $f_1, f_2, f_3$
  的首一最小公倍为$(\lambda-1)^2(\lambda+2)^2(\lambda+3),$
  因为$f_1, f_2, f_3$的所有的首一不可约因子有$\lambda-1, \lambda+2, \lambda+3$, 且在$f_1, f_2, f_3$中出现的最高次数分别为$2, 2,1$.
\item 要得到准对角阵$\begin{pmatrix}
        A_1 \\ & A_2 \\ & &\ddots \\ &&& A_k
      \end{pmatrix}$的标准形，我们可以化简每个对角块$A_i$的特征矩阵至标准形，
      求出其不变因子组，然后得到初等因子组，
      再把这些初等因子组合并就可得到$A$的初等因子组（这是初等因子组相对于不变因子组的优势），
      从而从$A$的初等因子组恢复出$A$的不变因子组。
      例如：
      令$A=\begin{pmatrix}
          2 & -1 \\
          & 2 \\
           & & 2 \\
            & & & 1
          \end{pmatrix}$, 那么$A$的第一个二阶对角块的不变因子组为$1, (\lambda-2)^2$, 初等因子组为$(\lambda-2)^2$;
          之后的两个一阶对角块的不变因子组分别为$\lambda-2$; $\lambda-1$, 初等因子组分别为$\lambda-2; \lambda-1$.
          所以$A$的初等因子组为$(\lambda-2)^2, \lambda-2, \lambda-1$, 
          $A$的不变因子组为$1,1,\lambda-2, (\lambda-2)^2(\lambda-1)$. 
  \end{enumerate}
  \end{remark}

\fi




\section{补充题和考研题}


\begin{exercise}
设 $\bR$ 是实数域，实向量空间 $\bR^{3}$ 两组向量分别为 $\alpha_{1}=(-1,1,0), \alpha_{2}=(2,-1,2), \alpha_{3}=$ $(0,1, b)$ 和 $\beta_{1}=(1,0,-1), \beta_{2}=(-1,1,1), \beta_{3}=(1,1, c)$.
\begin{enumerate}
\item  当 $b, c$ 取何值时，不存在 $\bR^{3}$ 上的线性变换 $\mathscr{T}$, 满足 $\mathscr{T}(\alpha_{i})=\beta_{i}, i=1,2,3$?
\item  当 $b, c$ 取何值时，至少存在两个 $\bR^{3}$ 上的线性变换 $\mathscr{T}$ 满足 $\mathscr{T}(\alpha_{i})=\beta_{i}, i= 1, 2, 3$?
\item  当 $b, c$ 取何值时，存在 $\bR^{3}$ 上唯一的线性变换 $\mathscr{T}$, 满足 $\mathscr{T}(\alpha_{i})=\beta_{i}, i=1,2,3$. 这样的线性变换是正交变换吗? 
\end{enumerate}
\end{exercise}

\begin{solution}
  行化简$A=\begin{pmatrix} 
    \alpha_1^{\rT} &   \alpha_2^{\rT} &  \alpha_3^{\rT}
  \end{pmatrix}$和$B=\begin{pmatrix} 
    \beta_1^{\rT} &   \beta_2^{\rT} &   \beta_3^{\rT}
\end{pmatrix}$可得
\[
  \begin{pmatrix} 
  -1 & 2 & 0 \\ 
1 & -1 & 1 \\ 
0 & 2 & b 
\end{pmatrix} 
\rightarrow 
\begin{pmatrix} 
1 & 0 & 2 \\ 
0 & 1 & 1 \\ 
0 & 0 & b-2 
\end{pmatrix}, 
\quad 
\begin{pmatrix} 
1 & -1 & 1 \\ 
0 & 1 & 1 \\ 
-1 & 1 & c 
\end{pmatrix} 
\rightarrow 
\begin{pmatrix} 
1 & 0 & 2 \\ 
0 & 1 & 1 \\ 
0 & 0 & c+1 
\end{pmatrix}.
\]
故$b \neq 2$时 $\alpha_1, \alpha_2, \alpha_3$线性无关，
而 $b=2$时$\alpha_1,\alpha_2$ 线性无关且 $\alpha_3 = 2\alpha_1 + \alpha_2$;
$c \neq -1$时$\beta_1, \beta_2, \beta_3$线性无关，
而 $c = -1$时$\beta_1, \beta_2$ 线性无关且 $\beta_3 = 2\beta_1 + \beta_2$. 



当$b=2, c \neq -1$时，$\alpha_1, \alpha_2, \alpha_3$线性相关
而$\beta_1, \beta_2, \beta_3$线性无关，此时 想要的 $\sT$ 不存在，
因为线性变换保持线性关系。

当$b=2, c=-1$时，将$\alpha_1, \alpha_2$扩充为$\bR^3$的基得$\alpha_1, \alpha_2, \alpha'_3$. 
只要$\sT(\alpha_i) = \beta_i$ ($i=1,2$), 则有
\[
  \sT(\alpha_3) = \sT(2\alpha_1 + \alpha_2) = 2\sT(\alpha_1) + \sT(\alpha_2) = 2\beta_1 + \beta_2 = \beta_3.
\]
当$\sT$在$\alpha'_3$上取值不同时便可得不同的$\sT$, 故此时
至少存在两个 $\bR^{3}$ 上的线性变换 $\mathscr{T}$ 满足 
$\mathscr{T}(\alpha_{i})=\beta_{i}$ ($i= 1, 2, 3$).

当$b \neq 2$ ($c$ 任意)时，$\alpha_1, \alpha_2, \alpha_3$构成$\bR^3$的基。
因为基上的映射可唯一地延拓为一线性映射，
所以使得$\sT(\alpha_i) = \beta_i$ ($i=1,2,3$) 的线性变换$\sT$唯一地存在。
为了确定此 $\sT$ 是否为正交变换，我们来看下 $\sT$在自然基$e_1,e_2,e_3$ 下的矩阵是否为正交矩阵。
我们有
\[
  \sT(e_1, e_2, e_3)A = \sT(\alpha_1, \alpha_2, \alpha_3)=(\beta_1,\beta_2,\beta_3) = (e_1, e_2, e_3)B,
\]
故
\[
  \sT(e_1, e_2, e_3) = (e_1, e_2, e_3)BA^{-1},
\]
这样 $\sT$在自然基下的矩阵 为 
\[
BA^{-1} = 
\begin{pmatrix} 
0 & 1 & 0 \\
1 & 1 & 0 \\
\frac{-2 c - 2}{b - 2} & \frac{-b - 2 c}{b - 2} & \frac{c + 1}{b - 2}
\end{pmatrix}.
\]
这不是正交矩阵，因为第二行的长度非 $1$. 故 $\sT$ 非正交变换。
\end{solution}


\begin{exercise}
设 $V$ 是一个 $n$ 维向量空间，$T:V\rightarrow V$ 是一个线性变换，且 $T$ 的像与核相同。
\begin{enumerate}
  \item  证明 $n$ 是偶数。
  \item 给出这样的线性变换 $T$ 的一个例子。
  \end{enumerate}
\end{exercise}

\begin{solution}

  (1) $\dim V=\dim\ker T+\dim \im T=2 \dim\ker T $ 是偶数。

  (2) 令 
\[
  T\colon  \bR^{(2)} \rightarrow \bR^{(2)},\begin{pmatrix}
  a 
  \\ b 
\end{pmatrix} \mapsto\begin{pmatrix}0 & 0 \\ 1 & 0\end{pmatrix}\begin{pmatrix}
  a \\b
\end{pmatrix}.
\]
那么 $\ker T=\im T=\Span \left( (0,1)^{\rT} \right)$.
\end{solution}



\begin{exercise}\tiyuan{\parencite[2024]{huazhongshida}}
  设 $\mathscr{A}$ 为不可逆线性变换，证明： 
  存在线性变换 $\mathscr{B} \neq 0$ 满足 $\mathscr{A} \mathscr{B}=\mathscr{B} \mathscr{A}=0$.
\end{exercise}

\begin{solution}
  \fangfa  设 $\sA$ 的最小多项式为 $m(\lambda)$. 由于 $\sA$ 不可逆，
  $0$ 为 $\sA$的特征值，从而
  $0$ 为 $m(\lambda)$ 的根，因此 $m(\lambda)$可分解为 $m(\lambda)=\lambda g(\lambda)$.
  令 $\sB=g(\sA)$, 那么 $\sB\neq 0$ 且 $\sA \sB=\sB\sA=m(\sA)=0$.

  \fangfa  $\sA$ 不可逆，故有特征值 $0$.
  设 $\sA$ 在一组基 $\BB$ 下的矩阵为 Jordan型矩阵 
\[
A=  J(\lambda_{1}, k_{1}) \oplus \cdots \oplus J (\lambda_{r}, k_{r}),
\]
其中 $\lambda_{1}=0$. 令 
\[
  B= J(0, k_{1})^{k_{1}-1} \oplus 0_{n-k_r, n-k_r} .
\]
那么 $A B=B A=0$. 令 $\sB$ 为在基 $\BB$下矩阵为 $B$ 的线性变换，
此时，$\sA\sB=\sB\sA=0$.
\end{solution}


\begin{exercise}
设 $V$ 为数域 $\bF$ 上有限维线性空间， $\sA \in \End(V)$. 
求证： 如果 $V$ 没有非平凡的 $\sA$-子空间， 
则 $\sA$ 的最小多项式为 $\bF$ 上的不可约多项式。
\end{exercise}


\begin{solution}
设 $\sA$ 的最小多项式 $m(\lambda)$ 分解为 $m(\lambda)=f(\lambda) g(\lambda)$. 
那么由 $m(\lambda)$ 的最小性可知 $f(\sA) \neq 0$,  $g(\sA) \neq 0$. 
此时 $\ker f(\sA)$ 为非平凡的 $\sA$-子空间，与题设矛盾了。
\end{solution}



\begin{exercise}\label{188}
  确定所有的线性映射$\varphi\colon \bF^{n\times n}\rightarrow \bF$使得对任意的$A, B\in \bF^{n\times n}$都有$\varphi(AB)=\varphi(BA)$.
\end{exercise}

\begin{solution}
  我们有
  $e_{i_1j_1}e_{i_2j_2}=\delta_{j_1i_2}e_{i_1j_2}$, 其中 $\delta_{j_1j_2}$ 是Kronecker记号。
  故
  \[
    \varphi(e_{ij})=\varphi(e_{ik}e_{kj})=\varphi(e_{kj}e_{ik})=
    \begin{cases}
      0& \text{若$i\neq j$},\\
      \varphi(e_{kk}) & \text{若$i=j$}.
    \end{cases}
  \]
  这样$\varphi(e_{ij})=0$, 对$i\neq j$; $\varphi(e_{ii})=\lambda$, 对任意$i$和某个$\lambda\in \bF$. 
  因此对$A=(a_{ij})$有
  \[
    \varphi(A)=\varphi(\sum_{i=1}^n a_{ij} e_{ij})=\sum_{i=1}^n a_{ij} \varphi(e_{ij}) = \lambda \sum_{i=1} a_{ii} = \lambda \tr(A).
  \]
  所以$\varphi$是取迹$\tr$的常数倍。反过来，$\tr$的常数倍当然是线性的且满足题目要求，
  所以所要求的线性函数恰好为$\tr$的倍。
  \iffalse
    由练习~\ref{060}~知形如$AB-BA$的矩阵张成的$\bF^{n\times n}$的子空间$V$可以描述为迹为$0$的矩阵构成的子空间；
  且$V$的维数$\dim V=n^2-1$. 设$\BB '$是$V$的一组基。
既然形如$AB-BA$的矩阵在$\varphi$下的像为$0$, $V\subset \ker f$. 
取一个迹非$0$的矩阵$C$ (比如单位矩阵), 则$(\BB ', C)$为$\bF^{n\times n}$的一组基 (通过取迹可发现线性无关性)。
此时必有$\varphi=\lambda \tr$, 其中$\lambda=f(C)/\tr(C)$, 因为$\varphi$与$\lambda \tr$在基$(\BB ', C)$中的所有元素上取值一致。 
显然$\tr$的倍数总满足对形如$AB-BA$的矩阵取值为$0$. 
这样满足$\varphi(AB)=\varphi(BA)$的线性映射$\varphi$恰好为$\tr$的倍。
\fi
\end{solution}


\begin{exercise}
  设$\sA$是有限维$\bF$-向量空间$V$上的线性变换，且$A$的秩为$r$.
  证明：存在$V$的一组基$v_1, \cdots, v_n$和$V$上的可逆线性变换$\sB$使得对任意的$a_1, \cdots, a_n\in \bF$有
  \[
    \sB\sA(\sum_{i=1}^n a_i v_i)=\sum_{i=1}^r a_i v_i.
  \]
\end{exercise}

\begin{solution}

  \fangfa 取$\im \sA$的基$w_1, \cdots, w_r$, 并将其延拓为$V$的基$(w_1, \cdots, w_n)$. 
  再取$v_1, \cdots, v_r$使得$\sA(v_i)=w_i$. 
  接着取$\ker \sA$的一组基$v_{r+1}, \cdots, v_n$. 
  此时$(v_1, \cdots, v_n)$为$V$的一组基。
  定义线性变换$\sB\colon V\rightarrow V$使得$\sB(w_i)=v_i$, 对$i=1,\cdots,n$. 显然$\sB$可逆。
  此时
  \[
    \sB\sA(v_i)=
    \begin{cases}
      \sB(w_i)=v_i, & \text{若$1\leqslant i\leqslant r$},\\
      \sB(0)=0, &\text{若$r+1\leqslant i\leqslant n$}.
    \end{cases}
  \]
  所以基$(v_1, \cdots, v_n)$和线性变换$\sB$满足所要求。

  \fangfa  矩阵版本的论证如下。设$\sA$在基$\BB $下的矩阵为$A$.
  $\rank A=r$ 表明存在可逆矩阵$P, Q$使得$PAQ=\begin{pmatrix}
    E_r \\ & 0
  \end{pmatrix}$.
  令$\sB$为在基$\BB $下的矩阵为$QP$的线性变换。
  这样$\sB\sA$的矩阵为$QPA$.
  进而$\sB\sA$在基$\BB Q$下的矩阵为
  \[
    Q^{-1}  (QPA) Q=PAQ=\begin{pmatrix}
    E_r \\ & 0
  \end{pmatrix}.
\]
这正是我们想要的。
\end{solution}


\begin{exercise}
  设$V$是有限维$\bF$-向量空间。对$V$中向量组$S=(v_1, \cdots, v_m)$, 定义
  \[
    W_S=\{(a_1, \cdots, a_m)\in \bF^{(m)}\mid \sum_{i=1}^m a_i v_i =0\}.
  \]
  \begin{enumerate}
    \item 证明$W_S$是$V$的子空间。
    \item 给定另一个向量组$S'=\{v_1', \cdots, v_m'\}$,
      证明存在$V$上的线性变换$\sB$使得对任意的指标$i$有
      $\sB(v_i)=v_i'$
      当且仅当$W_S\subset W_{S'}$,
存在可逆的线性变换$\sB$使得对任意的指标$i$有
      $\sB(v_i)=v_i'$
      当且仅当$W_S= W_{S'}$.
  \end{enumerate}
\end{exercise}

\begin{solution}
  (1) 固定$V$的一组基$\BB $. 对$v_i\in V$, 设$v_i$的坐标向量为$\alpha_i$. 
  给定向量组$S=(v_1, \cdots, v_m)$, 令$A=\begin{pmatrix}
    \alpha_1 & \cdots & \alpha_m
  \end{pmatrix}$, 那么$S$可以写成$S=\BB A$.  不妨称$A$为向量组$S$在基$\BB $下的坐标矩阵。
  此时
  \begin{align*}
    W_S&= \{(a_1, \cdots, a_m)\in \bF^{(m)}\mid \sum_{i=1}^m a_i v_i =0\}  \\
    &=  \{x\in \bF^{(m)}\mid Ax=0\}=\ker A.
  \end{align*}
  所以$W_S$是子空间。

  (2) 设$S'$的坐标矩阵为$A'$. 
  给定任意的线性变换$\sB$, 设其在基$\BB $下的矩阵为$B$. 
  这样$\sB(S)=\BB  BA$, 即向量组$\sB(S)$的坐标矩阵为$BA$. 
  所以使得$\sB(S)=S'$成立的线性变换$\sB$的存在性等价于使得$BA=A'$成立的方阵$B$的存在性。 
  若存在$B$使得$BA=A'$, 那显然有$W_S=\ker A\subset \ker A'=W_{S'}$.
  反过来，若$\ker A\subset \ker A'$, 取可逆的$P, Q$使得$PAQ=\begin{pmatrix}
    E_r \\ & 0
  \end{pmatrix}$. 
  此时
  \[
    \ker PAQ=\Span(e_{r+1}, \cdots, e_n)\subset \ker PA'Q. 
  \]
  这样$PA'Q$的后$n-r$列都是零列。设$PA'Q=\begin{pmatrix}
    B' & 0
  \end{pmatrix}$, 其中$B'$有$r$列。
  那么
  \[
    P(A'QP)AQ=(PA'Q) (PAQ)= \begin{pmatrix}
    B' & 0
  \end{pmatrix} \begin{pmatrix}
    E_r \\ & 0
  \end{pmatrix} = \begin{pmatrix}
    B' & 0
  \end{pmatrix} = PA'Q. 
\]
令$B=A' QP$, 则$BA=A'$. 
这就证明了想要的方阵$B$的存在性。

若$\sB$可逆，那么$S$与$S'$秩相等，从而$\rank A=\rank A'$. 
故而$\ker A\subset \ker A'$时必有$\ker A=\ker A'$. 
反过来，若$\ker A=\ker A'$, 我们也有$\rank S=\rank S'$.
假设$V$上的线性变换$\sB'$满足$\sB'(S)=\sB'(S')$. 
$\sB'$可以限制为一个线性同构$\sB\colon \Span S\rightarrow \Span S'$. 
此线性映射可以延拓为$V$上的可逆线性变换，且依然将$S$映到$S'$. 
\end{solution}

\begin{exercise}
  证明非零有限维向量空间上不存在线性变换$A, B$使得$AB-BA=E$, 其中$E$表示恒等变换。
  举例说明无限维向量空间上这样的线性变换$A, B$的存在性。
\end{exercise}

\begin{solution}
  $\tr (AB-BA)=0\neq \tr E$. 
  $\bC[x]$上的线性变换$A=\frac{d}{dx}$和$B=x\cdot$ (即$B$为用$x$乘)满足$AB-BA=E$.
\end{solution}

\begin{exercise}
  设$A, B\in \bF^{m\times n}$. 定义线性变换
  $T\colon \bF^{n\times m}\rightarrow \bF^{m\times n}, X\mapsto AXB$. 
  证明若$m\neq n$, 则$T$不可逆。
\end{exercise}

\begin{solution}

  我们有$T=T_1T_2=T_2T_1$, 其中
  \begin{align*}
  T_1\colon & \bF^{n\times m}\rightarrow \bF^{m\times m}, X\mapsto AX,\\
  T_2\colon & \bF^{n\times m}\rightarrow \bF^{n\times n}, X\mapsto XB.
\end{align*}
若$m>n$, $T_2$有非平凡的核 (因为维数之间的大小关系：$mn>n^2$)；
若$m<n$, $T_1$有非平凡的核 (因为维数之间的大小关系：$mn>m^2$)。
两种情形下都有$T$有非平凡的核，故$T$不可逆。
\end{solution}



\begin{exercise}
  设$V$是有限维向量空间，$V_1, V_2$是$V$的子空间，且$V=V_1\oplus V_2$. 
  证明$\sA\in \End(V)$可逆当且仅当$V=\sA(V_1)\oplus \sA(V_2)$.
\end{exercise}

\begin{solution}
  ($\Leftarrow$) 设$V=\sA(V_1)\oplus \sA(V_2)$. 
  对任意的$v\in V$, 存在$v_i\in V_i$使得$v=\sA(v_1) + \sA(v_2)=\sA(v_1+v_2)$, 
  这样$\sA$是满射。由于 $V$ 有限维，$\sA$ 是双射，从而可逆。
  %要证明$\sA$可逆，我们还需要证明$\sA$是单射，或者说，$\ker \sA=\{0\}$.
  %设$v\in V$满足$\sA (v)=0$. 
  %设$v=v_1+v_2$, 其中$v_i\in V_i$.
  %这样$0=\sA(v)=\sA(v_1) +\sA(v_2)$. 
  %由于$\sA(V_1)$与$\sA(V_2)$线性无关，$\sA(v_1)=\sA(v_2)=0$. 
  %这样

  ($\Rightarrow$) 设$\sA$可逆。对$v\in V$, 写$\sA^{-1} v= v_1+v_2$, 其中$v_1\in V_1, v_2\in V_2$. 
  这样$v=\sA (v_1) + \sA(v_2)\in \sA(V_1)+\sA(V_2)$. 这表明$V=\sA(V_1)+\sA(V_2)$. 
  为了证明$V=\sA(V_1)\oplus \sA(V_2)$, 我们还需证明$\sA(V_1)\cap \sA(V_2)=\{0\}$. 
  设$\sA(v_1)=\sA(v_2)\in \sA(V_1)\cap \sA(V_2)$, 其中$v_i\in V_i$.
  这样$\sA(v_1-v_2)=0$, 从而$v_1-v_2\in \ker \sA=0$, 故$v_1=v_2$.
  而$V_1\cap V_2=\{0\}$, 只能$v_1=v_2=0$. 得证。
\end{solution}

\begin{exercise}
  证明线性变换$T\colon \bC^{n\times n}\rightarrow \bC^{n\times n}, X\mapsto AX-XA$的秩不超过$n^2-n$.
\end{exercise}

\begin{solution}
  注意到 $\ker T$ 为 与$A$交换的方阵构成的空间 $\cC(A)$.
  设$A$的Jordan标准型为$J_1\oplus \cdots \oplus J_r$,
  其中$J_i=J(\lambda_i, s_i)$是$s_i$阶Jordan块。
  下面的$n$个矩阵
\[
  \begin{pmatrix}
    \delta_{i1} J_1^{k_1} \\
     & \ddots \\
     & & \delta_{ir} J_r^{k_r}
   \end{pmatrix}
\]
 (其中$1\leqslant i\leqslant r$, $0\leqslant k_i< s_i$)
线性无关且与$A$可交换。故$\cC(A)$至少为$n$维。
从而$\Null T=\dim \cC(A)\geqslant n$. 
因此$\rank T=n^2-\Null T\leqslant n^2-n$. 
\end{solution}


\begin{exercise}
  设有限维向量空间$V$有两个子空间$U, W$满足$\dim U+\dim W=\dim V$. 
  证明存在$V$上的线性变换$\sA$使得$U=\ker \sA, W=\im \sA$.
\end{exercise}

\begin{solution}

  设$\dim U=r, \dim W=s$. 
  取$V$的子空间$U'$使得$V=U\oplus U'$. 
  此时$\dim U'=\dim V-\dim U=s$. 
  分别取$U'$的基$(v_1, \cdots, v_s)$, 
  $U$的基$(v_{s+1}, \cdots, v_{s+r})$,
  $W$的基$(w_1, \cdots, w_s)$.
    基上的映射
    \[
      \begin{cases}
        \sA(v_i)=w_i, & i=1,\cdots,s\\
        \sA(v_i)=0, & i=s+1, \cdots, s+r.
      \end{cases}
    \]
    唯一地延拓为线性变换$\sA\colon V\rightarrow V$.
    $\sA$即为所要求。
\end{solution}



\begin{exercise}\label{0C0}
  设$A\in \bF^{n\times n}, B\in \bF^{m\times m}$. 
  定义$\bF^{n\times m}$上的线性变换
  $\varphi\colon X\mapsto AX$, 
  $\psi\colon X\mapsto XB$.
  求$\varphi, \psi, \varphi\psi$的迹和行列式 (用$A, B$的相关量表达)。
\end{exercise}


\begin{solution}
  设$A=(a_{ij}), B=(b_{ij})$.
  容易发现$\varphi, \psi$在基
  \[
    e_{11}, e_{21},\cdots, e_{n1}, e_{12}, e_{22}, \cdots, e_{n2}, \cdots, e_{1m}, e_{2m}, \cdots, e_{nm}
  \]
  下的矩阵分别为
  \[
    \left.\begin{pmatrix}
      A\\ &  A \\ & & \ddots \\ & & &  A
  \end{pmatrix}\right\} \text{$m$行},\quad 
    \begin{pmatrix}
      b_{11} E_n & b_{21} E_n & \cdots & b_{m1} E_n\\
      b_{12} E_n & b_{22} E_n & \cdots & b_{m2} E_n\\
      \vdots & \vdots  & & \vdots \\
      b_{1m} E_n & b_{2m} E_n & \cdots & b_{mm} E_n
    \end{pmatrix}.
  \]
  这样$\varphi\psi$在该基下矩阵为
  \[
    \begin{pmatrix}
        b_{11} A & b_{21} A & \cdots & b_{m1} A\\
        b_{12} A & b_{22} A & \cdots & b_{m2} A\\
      \vdots & \vdots  & & \vdots \\
      b_{1m} A & b_{2m} A & \cdots & b_{mm} A    
    \end{pmatrix}.
  \]
  另外，
  $\psi$在基
\[
e_{11}, e_{12},\cdots, e_{1m}, e_{21}, e_{22}, \cdots, e_{2m}, \cdots, e_{n1}, e_{n2}, \cdots, e_{nm}
\]
下的矩阵为
\[
  \underbrace{B^{\rT}\oplus B^{\rT}\oplus \cdots \oplus B^{\rT}}_{\text{$n$个}}.
\]
这样
\begin{gather*}
  \det \varphi=(\det A)^m,\quad  \det\psi =(\det B)^n, \quad
  \tr \varphi= m\tr A, \quad \tr \psi =n\tr B,\\
\det \varphi\psi= \det \varphi\det \psi=(\det A)^m(\det B)^{n},\quad
  \tr \varphi\psi = \tr A\tr B.
  \tag*{\qedhere}
  \end{gather*}
%且$\varphi, \psi$的特征多项式都是$p(\lambda)^n$, 其中$p(\lambda)$为$A$的特征多项式。
  %$\varphi_A$和${}_A\varphi$的迹为$n\tr A$, 行列式为$(\det A)^n$, 
 % 特征多项式为$p(\lambda)^n$, 其中$p(\lambda)$为$A$的特征多项式。
\end{solution}



\begin{exercise}
  考虑线性变换$T\colon \bR^{2\times 2}\rightarrow \bR^{2\times 2}, X\mapsto AXB$, 其中
  \[
    A=\begin{pmatrix}
      1 & 2  \\ -1  &3 
    \end{pmatrix},\qquad
    B=\begin{pmatrix}
      2 & 1\\
      0 & 4
    \end{pmatrix}.
  \]
  求$\det T, \tr T$.
\end{exercise}

\begin{solution}
  由练习~\ref{0C0}~知
  \[
    \det T = (\det A\det B)^2=1600, \quad \tr T=\tr A\tr B=24.
    \tag*{\qedhere}
  \]
\end{solution}

\begin{exercise}
  令$A=\diag(1,2,1)$. 求$\det T$, 其中线性变换$T$如下定义：
  \[
    T\colon \bR^{3\times 3}\rightarrow \bR^{3\times 3}, \quad X\mapsto \frac{1}{2}(AX+XA).
  \]
\end{exercise}


\begin{solution}
  注意到
  \[
    T\left(\sum_{i,j}a_{ij} e_{ij}\right)=\begin{pmatrix}
      a_{11} & \frac{3}{2} a_{12} & a_{13}\\
      \frac{3}{2} a_{21} & 2a_{22} & \frac{3}{2} a_{23} \\
      a_{31} & \frac{3}{2} a_{32} & a_{33}
    \end{pmatrix}.
  \]
  所以每个$e_{ij}$都是$T$的特征向量。相应的特征值的乘积给出了行列式
  \[
    \det T=2\times \left( \frac{3}{2} \right)^4=\frac{81}{8}.
\tag*{\qedhere}
  \]
\end{solution}

\begin{exercise}
  令$A=\diag(1,1,1,1,-1,-1,-1)$. 求$\rank T$, 其中线性变换$T$如下定义：
  \[
    T\colon \bR^{7\times 7}\rightarrow \bR^{7\times 7}, X\mapsto AX-XA.
  \]
\end{exercise}

\begin{solution}
  我们有$\dim \im T=\dim \bR^{7\times 7}-\dim \ker T$, 我们只用计算出$\dim\ker T$即可。
  我们来计算$\ker T$, 或者与$A$可交换的方阵的集合。
  由练习~\ref{077}~可知
  \[
    \ker T=\{A_1\oplus A_2\mid A_1\in \bR^{4\times 4}, A_2\in \bR^{3\times 3}\}.
  \]
  所以$\dim \ker T=25$, $\dim \im T=24$. 
\end{solution}

\begin{exercise}\tiyuan{\parencite[2024]{wuda}}
  设 $n$ 维欧氏空间 $V$ 上的线性变换 $\mathscr{A}$ 满足 $\mathscr{A}^{3}+\mathscr{A}=0$.
证明：  $\mathscr{A}$ 的迹等于 $0$.
\end{exercise}


\begin{solution}
$x^{3}+x$ 为在 $\bR$ 上的标准分解。
$\sA$ 的最小多项式 $m(x)$ 整除 $x^{3}+x$, 从而其首一不可约因子在 $x, x^{2}+1$ 中。
$\sA$ 的最小多项式 $m(x)$与 $\sA$ 的特征多项式 $p(x)$ 有相同的复根，
从而两个实系数多项式在 $\bR$ 上有相同的不可约因子，
这样 $p(x)=x^{k}(x^{2}+1)^{l}$, 其中 $k,l\geqslant 0$且 $k+2l=n$. 
显然 $p(x)$ 中 $x^{n-1}$ 的系数为 $0$, 故 $\tr A=0$. 
\end{solution}

\begin{exercise}
  设$V_{\bC}$是$\bC$上有限维向量空间，$V$上的加法和实数的乘法定义了$V$的实向量空间结构，这个向量空间我们记为$V_{\bR}$.
  考虑复线性变换$\symscr{A}\in \End(V_{\bC})$, $\symscr{A}$显然也是实线性的。
  设$\symscr{A}$在$V_{\bC}$的一组基下的矩阵为$A_{\bC}$, 在$V_{\bR}$的一组基下的矩阵为$A_{\bR}$.
  证明$\det A_{\bR}=|\det A_{\bC}|^2$.
\end{exercise}

\begin{solution}

  设$V_{\bC}$的一组基为$\BB =(v_1, \cdots, v_n)$. 
  我们断言$\BB '=(v_1, i\, v_1, \cdots, v_n, i\,v_n)$是$V_{\bR}$的一组基。
  由于$V$中向量都是$v_1, \cdots, v_n$的复系数的线性组合，
  显然有$V$中向量是$v_1, i\, v_1, \cdots, v_n, i\,v_n$的实系数线性组合。
  并且容易发现$v_1, i\, v_1, \cdots, v_n, i\,v_n$在$\bR$上线性无关。
  所以$\BB '=(v_1, i\, v_1, \cdots, v_n, i\,v_n)$是$V_{\bR}$的一组基。
  注意到：如果$\symscr{A}$在基$\BB $下的矩阵为$A_{\bC}=(a_{ij}+i\, b_{ij})$, 其中$a_{ij}, b_{ij}\in \bR$,  
  那么$\symscr{A}$在基$\BB '$下的矩阵为$A_{\bR}=(A_{ij})$, 
  其中$A_{ij}=
  \begin{pmatrix}
    a_{ij} & -b_{ij} \\
    b_{ij} & a_{ij}
  \end{pmatrix}$.
  特别地，取$V_{\bC}$的一组基$\BB $使得$A_{\bC}=J_1\oplus \cdots \oplus J_k$为Jordan型矩阵，
  其中$J_i=J(a_i+i\, b_i, k_i)$, 
  再令
  $B_i=\begin{pmatrix}
    a_i & -b_i\\ b_i & a_i
  \end{pmatrix},$
  那么相应的$A_{\bR}=J_1' \oplus \cdots \oplus J_k'$, 
  其中
  \[
    J_i'=\begin{pmatrix}
      B_i\\ E_2  & \ddots \\ & \ddots & \ddots \\ & & E_2 & B_i
    \end{pmatrix}.
  \]
  这样
  \[
    \det A_{\bR}=\prod \det J_i' = \prod \det |J_i|^2 = |\det A_{\bC}|^2.
\tag*{\qedhere}
  \]
\end{solution}

\begin{exercise}
设有实矩阵 
\[
A = \begin{pmatrix} 3 & 4 & -5 \\ 6 & 3 & -4 \\ 6 & 4 & -6 \end{pmatrix},\quad 
P=
\begin{pmatrix}
0 & 1 & 0 \\
1& 0& 1\\
0 & 0 & 1
\end{pmatrix},
\quad B = P^{-1}A^* P + 2E_3.
\]
求 $B$ 在实数域上的特征值和特征向量。
\end{exercise}

\begin{solution}
$B = P^{-1}(A^* + 2E)P$ 与 $A_1=A^* + 2E$ 相似， 
我们先来求 $A^* + 2E_3$ 的特征值和特征向量。 
为此， 实际上只需求 $A$ 的特征值和特征向量 (后面我们会看到确是如此).

 $A$ 的特征多项式为
 \[
 \begin{aligned}
  | \lambda E - A | &= 
 \begin{vmatrix}
  \lambda - 3 & -4 & 5 \\
 -6 & \lambda - 3 & 4 \\
  -6 & -4 & \lambda + 6
 \end{vmatrix}
  \overset{\circled{1}}{=}
 \begin{vmatrix}
  \lambda - 3 & \lambda-3 & -\lambda+3 \\
 0 & \lambda + 1 & -\lambda - 2 \\
  -6 & -4 & \lambda + 6
 \end{vmatrix} \\
   &=  (\lambda - 3) \begin{vmatrix} 1 & 1 & -1 \\ 0 & \lambda + 1 & -\lambda - 2 \\ -6 & -4 & \lambda + 6 \end{vmatrix}\\
   &=  (\lambda - 3)(\lambda^2 + 3\lambda + 4),
 \end{aligned}
 \]
 其中 \circled{1} 是做了初等变换 $r_2-r_3$, $r_1+r_2$.
 故 $A$ 有唯一的实特征值 $3$; 且 $|A| = 12$, 从而 $A_1 = A^* + 2E = 12A^{-1} + 2E$.
 解齐次线性方程组 $(3E - A)X = 0$ 得一基础解系 $\eta = (8, 15, 12)^{\rT}$. 
 故 $A$ 的属于 $3$ 的所有特征值向量为 $\{c\eta \mid c \neq 0\}$.

若 $\lambda_i$ ($i = 1, 2, 3$) 为 $A$ 的全部复特征值， 
则 $A_1$ 的所有复特征值为 $12\lambda_i^{-1} + 2$ ($i = 1, 2, 3$). 
显然 $\lambda_i \in \bR$ 当且仅当 $12\lambda_i^{-1} + 2 \in \bR$. 
这样 $A_1$ 的实特征值只有 $12 \times \frac 1 3 + 2 = 6$. 
而且，由 $A_1 = 12A^{-1} + 2E$ 知 $(3, \xi)$ 为 $A$ 的特征对时
$(6, \xi)$ 为 $A_1$ 的特征对： $A\xi=3\xi$ 表明 $A^{-1}\xi=\frac{1}{3}\xi$, 从而
\[
  A_1\xi= (12A^{-1} + 2E)\xi=12\times \frac{1}{3}\xi + 2\xi = 6\xi.
\]
反过来，类似地由 $A = 12(A_1 - 2E)^{-1}$ 知 $(6, \xi)$ 为 $A_1$ 的特征对时
$(3, \xi)$ 为 $A$ 的特征对。
这样$A_1$ 的属于特征值 $6$ 的特征向量的集合与 $A$ 的属于特征值 $3$ 的特征向量的集合相同， 
也是 $\{c\eta \mid c \neq 0\}$.
\emph{除此之外，也可如下判断得到此事实}：$A$ 还有两个互为共轭的虚特征值，分别给出了
$A_1$ 的两个互为共轭的虚特征值。这样$A_1$ 有三个不同的特征值，重数都是 $1$.
故特征值 $6$ 的几何重数为 $1$. 既然 $\eta$ 是一个属于 $6$ 的特征向量，
特征值 $6$ 的特征子空间可由 $\eta$ 生成。
 
 %容易发现： $\xi$ 的特征向量当且仅当 $P^{-1}\xi$ 为 $B = P^{-1}A_1P$ 的特征向量。
 $A_1$ 与 $B$ 相似， 故有相同的实特征值， 而且，
 $(6, \xi)$ 为 $A_1$ 的特征对当且仅当 $(6, P^{-1}\xi)$ 为 $B$ 的特征对。
 这样，$B$有唯一的实特征值 $6$, 且$B$ 的属于特征值$6$ 的所有特征向量为
 \[
   \{cP^{-1}\eta\mid c\neq 0\}=\{c(3,8,12)\mid c\neq 0\}.
   \tag*{\qedhere}
 \]
\end{solution}

\begin{remark}
  对方阵 $A$ 和 多项式 $f(x)$, 若 $(\lambda,\xi)$ 为 $A$ 的特征对，
  则 $(f(\lambda), \xi)$ 为 $f(A)$ 的特征对；
  特别地，$A$的特征向量都是 $f(A)$ 的特征向量。
  若 $A, A'$ 互为彼此的多项式 (如上题中的 $A, A_1$), 
  则 $A, A'$ 有相同的特征向量。
  另外，对可逆的 $A$, $(\lambda, \xi)$ 为  $A$ 的特征对当且仅当 
  $(\lambda^{-1},\xi)$ 为  $A^{-1}$ 的特征对；
  特别地，$A, A^{-1}$ 有相同的特征向量。
\end{remark}

\begin{exercise}
  设$A\in \bR^{n\times n}$是正定的实对称矩阵，其中$n>1$. 设$0\neq \alpha\in \bR^{(n)}$.
  令$B=A\alpha\alpha^{\rT}$. 求$B$的最大的特征值以及$B$的属于这个特征值的特征子空间的维数和一组基。
\end{exercise}

\begin{solution}
  $B$ 的特征多项式为 
  \[
    \det(\lambda E-A\alpha\alpha^{\rT})=\lambda^{n-1}(\lambda-\alpha^{\rT}A\alpha).
  \]
  由 $A$ 正定知 $\alpha^{\rT}A\alpha>0$. 这样 $B$ 的最大的特征值为 $\alpha^{\rT}A\alpha$, 属于此特征值的特征子空间的
  维数为$1$ (因为几何重数不超过代数重数), 此空间的一组基为 $A\alpha$.
\end{solution}


\begin{exercise}
  设$A, B$是$n$阶复方阵，且满足$AB=2A+B$. 
  \begin{enumerate}
    \item 若 $A$ 的$n$个特征值为 $\lambda_1,\cdots,\lambda_n$,
      求 $B$ 的 $n$个特征值。
    \item 证明$A, B$ 有相同的特征向量。
    \item 证明$A$可对角化当且仅当$B$可对角化。
  \end{enumerate}
\end{exercise}

\begin{solution}
  \fangfa
  (1) 由 $AB=2A+B$可知 $(E-A)(2E-B)=2E$. 
若 $A$ 的$n$个特征值为 $\lambda_1,\cdots,\lambda_n$,
则 $E-A$的$n$个特征值为 $1-\lambda_1,\cdots,1-\lambda_n$, 
从而$2E-B=2(E-A)^{-1}$的$n$个特征值为 $2(1-\lambda_1)^{-1},\cdots,2(1-\lambda_n)^{-1}$, 
进而 $B$的$n$个特征值为 $2-2(1-\lambda_1)^{-1},\cdots,2-2(1-\lambda_n)^{-1}$,
亦即 $\frac{2\lambda_1}{\lambda_1-1},\cdots,\frac{2\lambda_n}{\lambda_n-1}$.
 \iffalse
   \fangfa
我们有 $A(B-2 E)=B$. 我们先来说明 $2$ 不是 $B$ 的特征值。 存在可逆矩阵 $P$ 使得
\[
  P^{-1}A P=\begin{pmatrix}
    \lambda_{1} &*  & \cdots& * \\
  & \ddots& \ddots  & \vdots\\
& & \ddots & * \\
& & & \lambda_{n}
\end{pmatrix}
\]
为上三角矩阵。令 $A_{1}=P^{-1} A P$, $B_{1}=P^{-1} B P$, 则 $A_{1}(B_{1}-2 E)=B_{1}$. 
若 $B$ 有特征值 $2$，则选取合适的 $P$ 可设 $\lambda_{1}=2$. 
但此时 $A_{1}(B_1-2 E)$ 的 $(1,1)$ 元素为 $0$, 故 $A_{1}(B_{1}-2 E) \neq B_{1}$, 矛盾了。
故$B$没有特征值为 $2$，从而 $B-2 E$ 可逆，且 
\[
  A=B(B-2 E)^{-1}=E+2(B-2 E)^{-1}.
\]
既然 $B$ 的 $n$ 个特征值为 $\lambda_{1}, \cdots, \lambda_{n}$,
$(B-2 E)^{-1}$ 的 $n$ 个特征值为 $\frac{1}{\lambda_{1}-2}, \cdots, \frac{1}{\lambda_{n}-2}$, 
从而 $A$ 的 $n$ 个特旋值为
\(
1+\frac{2}{\lambda_{1}-2}, \cdots, 1+\frac{2}{\lambda_{n}-2}.
\)
\fi

(2) %由于基域是复数域，$B$的特征多项式有根，故$B$有特征值，相应地，$B$有特征向量。
令 $\lambda$ 为 $B$ 的一个特征值， 
$\xi\neq 0$是相应的的一个特征向量，则 $B\xi=\lambda \xi$.
既然$AB=2A+B$, 我们有$(AB-2A-B)\xi=0$, $(\lambda-2)A\xi=\lambda \xi$.
注意到 $\lambda\neq 2$, 否则 $\xi=0$.
这样$A\xi = \frac{\lambda}{\lambda-2}\xi$, 从而$\xi$也是$A$的特征值。
这就证明了$B$的特征向量都是$A$的特征向量。
由 $AB=2A+B$ 可知 $(E-A)(2E-B)=2E$, 利用互逆矩阵的可交换性我们也有 $(2E-B)(E-A)=2E$, 
这样 $BA=2A+B$. 此时类似地可以证得 $A$ 的特征向量都是 $B$ 的特征向量。
\iffalse
由 $AB=2A+B$可知 $(E+A)(2E+B)=E$. 若 $(\lambda, \xi)$ 为 $A$的一个特征对 
(即 $\lambda$ 是 $A$ 的一个特征值，$\xi$ 是相应的一个特征向量), 
则 $(1+\lambda, \xi)$ 为 $E+A$的一个特征对 (注意到 $E+A$ 可逆，故 $\lambda\neq -1$)，
从而 $(\frac{1}{1+\lambda}, \xi)$ 为 $2E+B=(E+A)^{-1}$ 的一个特征对，
进而 $(\frac{1}{1+\lambda}-2, \xi), \xi$ 为 $B$ 的一个特征对。
  类似可知，若 $(\mu,\eta)$ 为 $B$ 的一个特征对，则 $(, \eta)$
  为 $A$ 的一个特征对。
\fi


(3) 若$B$可对角化，那么$B$有$n$个线性无关的特征向量。
由(2) 知这些特征向量也是$A$的特征向量，
从而$A$有$n$个线性无关的特征向量，所以$A$可对角化。
类似可知 $A$可对角化时 $B$亦可对角化。
\iffalse
      要证明$A$可对角化时$B$亦可，我们有下面两种思路。\\
      \fangfa [思路]{1}与(1)中类似地，我们考虑左特征向量\footnote{如果不想考虑左特征向量，可以考虑$A^{\rT}$和$B^{\rT}$的右特征向量，同时注意到$A$可对角化当且仅当$A^{\rT}$可。}，那么之前的论证都可以平行地搬过来。
      容易验证若$\xi\neq 0$是$A$的属于特征值$\lambda$的左特征向量，
      即$\xi A=\lambda \xi$, 那么由$\xi(A+B+AB)=0$知
      $\xi B=-\frac{\lambda}{\lambda+1}\xi$, 所以$\xi$也是$B$的左特征向量。
      若$A$可对角化，那么$A$有$n$个线性无关的左特征向量，进而$B$亦有，所以$B$可对角化。\\
      \fangfa [思路]{2} 由$A+B+AB=0$知$A+B+AB+E=E$, 即$(A+E)(B+E)=E$. 
      这样$A+E, B+E$互逆。所以我们亦有$(B+E)(A+E)=E$, 即$A+B+BA=0$.
      从$A+B+BA=0$出发将之前的讨论再进行一次，同时交换$A, B$的角色，我们可知$A$的特征向量都是$B$的特征向量。
      若$A$可对角化，相当于有$n$个线性无关的特征向量，那么$B$有$n$个线性无关的特征向量，故$B$可对角化。
 
  \vspace{0.5em}
 \noindent \fangfa  由于$A+B+AB=0$, 我们有$A+B+AB+E=E$, 即$(A+E)(B+E)=E$. 
  这样$A+E, B+E$互逆。所以我们亦有$(B+E)(A+E)=E$, 即$A+B+BA=0$. 从而$AB=BA$.
  考虑$B$左乘诱导的线性变换$\bC^{(n)}\rightarrow \bC^{(n)}, x\mapsto Bx$, 亦记为$B$
   (后面可从上下文判断我们的$B$指的是矩阵还是线性变换)。
  \begin{enumerate}
    \item 我们知道可逆矩阵$C$的属于特征值$\lambda$的特征向量都是其逆矩阵$C^{-1}$的属于特征值$\lambda^{-1}$的特征向量。
      这样$B+E$的特征向量都是$A+E$的特征向量。而$B$与$B+E$有相同的特征向量，$A$与$A+E$也是。
      这样$B$的特征向量都是$A$的特征向量。
  \item 我们证明$A$可相似对角化时$B$亦可，交换$A, B$的角色可得到反过来的结论。
    设\[
      P^{-1}AP=\diag(\lambda_1, \cdots, \lambda_n).
    \]
    这样
    \[
      P^{-1}(A+E)P=\diag(\lambda_1+1, \cdots, \lambda_n+1).
    \]
    两边取逆得
    \[
      P^{-1}(B+E)P=P^{-1}(A+E)^{-1}P=\diag\left((\lambda_1+1)^{-1}, \cdots, (\lambda_n+1)^{-1}\right).
    \]
    从而
    \[
      P^{-1}BP=\diag\left((\lambda_1+1)^{-1}-1, \cdots, (\lambda_n+1)^{-1}-1\right).
    \]
    这就证明了$B$可相似对角化。
  \end{enumerate}
\fi

\fangfa  由于$AB=2A+B$, 我们有 $(E-A)(2E-B)=2E$. 
这样$E-A, \frac{1}{2}(2E-B)$互逆。由于任意的可逆矩阵$C$的逆可表为 $C$的多项式 
(注记 \ref{046})，我们有$E-A$是$\frac{1}{2}(2E-B)$的多项式，
$\frac{1}{2}(2E-B)$也是$E+A$的多项式，
进而$A$是$B$的多项式，$B$也是$A$的多项式。设$A=f(B), B=g(A)$, 其中$f, g\in \bC[x]$. 

(1) 如方法一中(1).

%由于基域是复数域，$A$的特征多项式有根，故$A$有一个特征值$\lambda_0$; 相应地，$A$有一个特征向量$\xi$.
  (2) $B$有一个特征值$\lambda_0$, 相应的一个特征向量为$\xi$.
显然对任意的非负整数$k$, 我们有$B^k \xi = \lambda_0^k \xi$, 进而$f(B)\xi=f(\lambda_0)\xi$.
所以$\xi$也是$A=f(B)$的特征向量，属于特征值$f(\lambda_0)$.
类似可知 $A$的特征向量都是$B$的特征向量。

(3) 我们证明$A$可相似对角化时$B$亦可，交换$A, B$的角色可得到反过来的结论。
设$A$可相似对角化，比如$P^{-1}AP=\diag(\lambda_1, \cdots, \lambda_n)$. 
显然对非负整数$k$有
\[
P^{-1}A^kP=\diag(\lambda_1^k, \cdots, \lambda_n^k).
\]
进而
\[
P^{-1}BP=P^{-1}g(A)P=\diag(g(\lambda_1), \cdots, g(\lambda_n)).
\]
这就证明了$B$可相似对角化。%除了上面的论证，我们也可以用有$n$个线性无关的特征向量这个对角化的等价条件来论证。
\end{solution}



\begin{exercise}
  记$\SL_2(\bR)$为行列式为$1$的二阶实矩阵构成的群。
  假设$A\in \SL_2(\bR)$没有实特征值。
  证明存在$B\in \SL_2(\bR)$使得$B^{-1}AB$等于旋转矩阵$\begin{pmatrix}
    \cos \theta & -\sin\theta\\ \sin\theta & \cos \theta
  \end{pmatrix}$, 对某个$\theta\in \bR$.
\end{exercise}

\begin{solution}

  实矩阵$A$的特征多项式为二次的实系数多项式，而按假设$A$没有实特征值，
  从而$A$的特征值为虚数，且以共轭对的形式成对出现，比如说$\lambda$和$\bar{\lambda}$. 
  由于$\det A=1$, 我们有$\lambda\bar{\lambda}=1$, 即$|\lambda|=1$. 
  这样可设$\lambda=\cos\theta+i\,\sin\theta$. 
  取$0\neq v=\alpha+i\, \beta\in \bC^{(2)}$使得$Av=\lambda v$, 其中$\alpha, \beta\in \bR^{(2)}$.
  对$Av=\lambda v$取实部和虚部得
  \[
    A \alpha=(\cos \theta)\alpha-(\sin\theta) \beta,\quad A\beta  = (\sin \theta) \alpha +(\cos\theta) \beta.
  \]
  又注意到$A(\alpha-i\,\beta)=\bar{\lambda}(\alpha-i\,\beta)$及$\lambda\neq \bar{\lambda}$,
  我们有$\alpha+i\,\beta$与$\alpha-i\,\beta$在$\bC$上线性无关，
  所以$\alpha, \beta$在$\bR$上线性无关。 
  令
    $P=\begin{pmatrix}
    \alpha & \beta
  \end{pmatrix}$. 若$\det P>0$, 我们令$B=\frac{1}{\sqrt{\det P}}P$, 
则$B\in \SL_2(\bR)$, 
  且我们有
  \[
    B^{-1}AB=\begin{pmatrix}
    \cos \theta & \sin\theta\\ -\sin\theta & \cos \theta
  \end{pmatrix},
\]
这是旋转$-\theta$角度的旋转矩阵。
若$\det P<0$, 重新令$P=\begin{pmatrix}
  \beta & \alpha
\end{pmatrix}$, 再令$B=\frac{1}{\sqrt{\det P}}P$, 则$B\in \SL_2(\bR)$,
且我们有\[
    B^{-1}AB=\begin{pmatrix}
    \cos \theta & -\sin\theta\\ \sin\theta & \cos \theta
  \end{pmatrix}.
\tag*{\qedhere}
\]
\end{solution}

\begin{exercise}\label{1EF}
  设$V$是有限维向量空间，$\sA_1, \cdots, \sA_s$为$V$上的线性变换。
  令$\sA=\sA_1+\cdots+\sA_s$.
  证明$\sA$是幂等的且满足$\rank \sA =\rank \sA_1+\cdots+\rank  \sA_s$当且仅当所有的$\sA_i$是幂等的且满足$\sA_i\sA_j=0$, 对$i\neq j$.
\end{exercise}

\begin{solution}
  令$\dim V=n$. 对于幂等的线性变换$\sA$, 我们知道存在一组基使得$\sA$的矩阵为$\begin{pmatrix}
    E_r \\ & 0
  \end{pmatrix}$; 此时$\sE-\sA$在该基下的矩阵为$\begin{pmatrix}
    0 \\ & E_{n-r}
  \end{pmatrix}$. 因此
  \[
    \rank \sA=\tr \sA,\quad \rank \sA + \rank (\sE-\sA)=n.
  \]

  ($\Rightarrow$)   令$\sA_{s+1}=\sE-\sA$. 那么
  \[
    \sum_{i=1}^{s+1} \sA_i=\sE,\quad \sum_{i=1}^{s+1} \rank \sA_i=\dim V.
  \]
  这样
  \[
    V=\sum_{i=1}^{s+1} \im \sA_i, \quad \dim V=\sum_{i=1}^{s+1} \dim \im \sA_i.
  \]
  所以$V=\sum_{i=1}^{s+1} \im \sA_i$是直和。
  对$v\in V$, 
  \[
    \sA_j(v) = \sum_{i=1}^{s+1} \sA_i(\sA_j(v));
  \]
  而$V=\sum_{i=1}^{s+1} \im \sA_i$是直和，我们有
  \[
    \sA_j(v)=\sA_j\sA_j(v);\quad  \sA_i(\sA_j(v))=0, \text{对$i\neq j$}.
  \]
  这样$\sA_j^2=\sA_j$; $\sA_i\sA_j=0$, 对$i\neq j$.

  ($\Leftarrow$) 我们有
  \[
    \sA^2=\left( \sum_{i=1}^s \sA_i \right)^2=\sum_{i=1}^s \sA_i=\sA,
  \]
  故$\sA$幂等。
  进而
  \[\tag*{\qedhere}
    \rank \sA =\tr \sA =\sum_{i=1}^s \tr \sA_i=\sum_{i=1}^s \rank \sA_i.
  \]
\end{solution}




\begin{exercise}
  设$\sA$是$n$维实向量空间$V$上的线性变换，其中$n\geqslant 1$.
  证明$\sA$至少有一个维数为$1$或$2$的不变子空间。
\end{exercise}

\begin{solution}

  可设$V=\bR^{(n)}$. 
  设$\lambda\in\bC$为$\sA$的一个特征值。
  若$\lambda$是实数，那么对应于$\lambda$的任一特征向量张成$\sA$的一个$1$维不变子空间。
  若$\lambda=a+i\,b$是虚数，令$\alpha+i\,\beta$是相应的一个特征向量，其中$\alpha, \beta\in \bR^{(n)}$. 
  \[
    \sA (\alpha+i\,\beta)=(a+i\,b)(\alpha+i\,\beta)
  \]
  表明
  \[
    \sA \alpha=a\alpha -b\beta,\quad \sA \beta=b\alpha+ a\beta.
  \]
  这样$\Span(\alpha, \beta)$是$\sA$的一个不变子空间。
\end{solution}

\begin{exercise}\label{0CB}
  证明：对方阵$A\in \bF^{n\times n}$, $A$是纯量矩阵当且仅当任意的$\bF^{(n)}$中非零向量都是$A$的特征向量。
\end{exercise}

\begin{solution}

  ($\Rightarrow$)显然成立，我们证($\Leftarrow$)。
  设任意的$\bF^{(n)}$中非零向量都是$A$的特征向量。
  特别地，在$\bF^{(n)}$的标准基$(e_1, \cdots, e_n)$下$A$是对角的，比如说$\diag(\lambda_1, \cdots, \lambda_n)$.
  若$\lambda_i\neq \lambda_j$, 
  则$A(e_i+e_j)=\lambda_i e_i+\lambda_j e_j$ 非$e_i+e_j$的倍，
  从而$e_i+e_j$不是$A$的特征向量，矛盾了。
  所以这些$\lambda_i$都相等，进而$A$是纯量矩阵。
\end{solution}

\begin{exercise}\label{1F0}
  设$A=\begin{pmatrix}
    1 & 0 & 0\\
    1 & 0 & 1\\
    0 & 1 & 0
  \end{pmatrix}\in \bR^{3\times 3}$.
  证明对$n\geqslant 3$有$A^n=A^{n-2}+A^2-E$, 并计算$A^{100}$.
\end{exercise}

\begin{solution}
  容易算得$A$的特征多项式为$p(\lambda)=(\lambda-1)^2(\lambda+1)$. 
   (这里$A$的最小多项式也是$p(\lambda)$. 有时最小多项式次数更低，可能计算起来更方便。)
  由Hamilton-Cayley定理知$p(A)=0$. 
  $n\geqslant 3$时我们有
  \begin{align*}
    f(\lambda)&= \lambda^{n}-\lambda^{n-2}-\lambda^2+1=(\lambda^{n-2}-1)(\lambda^2-1)\\
    &= (1+\lambda+\cdots+\lambda^{n-3})(\lambda-1)^2(\lambda+1).
  \end{align*}
  所以$p(\lambda)\mid f(\lambda)$, 从而$f(A)=0$, 即$A^{n}-A^{n-2}-A^2+E=0$.
  从而$A^n-A^{n-2}=A^2-E$. 这样
  \begin{align*}
    A^{100}&= (A^{100}-A^{98})+\cdots+(A^{2}-E)+E=\sum_{i=1}^{50}(A^{2i}-A^{2i-2})+E\\
    &= 50(A^2-E)+E=\begin{pmatrix}
      1 & 0& 0\\
      50 & 1 & 0\\
      50 & 0 & 1
    \end{pmatrix}.
\tag*{\qedhere}
  \end{align*}
\end{solution}



\begin{exercise}
  证明：对任意的实数$\alpha$有
  \[
      \lim_{n\rightarrow \infty} 
      \begin{pmatrix}
        1 & \frac{\alpha}{n} \\
        -\frac{\alpha}{n} & 1
      \end{pmatrix}^n = \begin{pmatrix}
        \cos\alpha & \sin \alpha\\
        -\sin \alpha & \cos\alpha
      \end{pmatrix}.
  \]
\end{exercise}

\begin{solution}

  若$\alpha=0$, 结论显然。设$\alpha\neq 0$. 令
  $A=\begin{pmatrix}
        1 & \frac{\alpha}{n} \\
        -\frac{\alpha}{n} & 1
      \end{pmatrix}$.
  容易算得$A$有两个特征值$1+\frac{\alpha}{n}\, i, 1-\frac{\alpha}{n}\, i$.
  进而可计算得属于特征值$1+\frac{\alpha}{n}\, i$的一个特征向量$(i, -1)^{\rT}$; 
  这样取共轭可知属于特征值$1-\frac{\alpha}{n}\, i$的一个特征向量$(-i, -1)^{\rT}$.
  令$P=\begin{pmatrix}
    i & -i \\ -1 & -1
  \end{pmatrix}$.
  那么
  \[
    P^{-1}AP=\begin{pmatrix}
    1+\frac{\alpha}{n}\,i\\
    & 1-\frac{\alpha}{n}\,i
  \end{pmatrix}.
\]
因此
  \begin{align*}
    A^n&= P\begin{pmatrix}
      (1+\frac{\alpha}{n}\,i)^n\\
      & (1-\frac{\alpha}{n}\,i)^n
    \end{pmatrix}P^{-1}\\
    &= \begin{pmatrix}
      i & -i \\ -1 & -1 
    \end{pmatrix} \begin{pmatrix}
      (1+\frac{\alpha}{n}\,i)^n\\
      & (1-\frac{\alpha}{n}\,i)^n
    \end{pmatrix} 
    \cdot \frac{i}{2} \begin{pmatrix}
      -1 & i \\ 1 & i
    \end{pmatrix}\\
    &= \frac{1}{2}\begin{pmatrix}
      \left( 1+\frac{\alpha}{n}\,i \right)^n + \left( 1-\frac{\alpha}{n}\,i \right)^n & 
      -\left( 1+\frac{\alpha}{n}\,i \right)^n\, i + \left( 1-\frac{\alpha}{n}\,i \right)^n\, i \\ 
      \left( 1+\frac{\alpha}{n}\,i \right)^n\, i - \left( 1-\frac{\alpha}{n}\,i \right)^n\, i  & 
      \left( 1+\frac{\alpha}{n}\,i \right)^n + \left( 1-\frac{\alpha}{n}\,i \right)^n
    \end{pmatrix}.
  \end{align*}
  由于
  \[
    \lim_{n\rightarrow \infty} \left( 1+\frac{\alpha}{n}\,i \right)^n
    = \lim_{n\rightarrow\infty} e^{n\log(1+\frac{\alpha}{n}\,i)} 
    = \lim_{n\rightarrow\infty} e^{n\left(\frac{\alpha}{n}\,i + O(\frac{1}{n^2})\right)} 
      = e^{\alpha\,i},
  \]
  我们有
  \[
    \lim_{n\rightarrow \infty} A^n= 
    \begin{pmatrix}
        \cos\alpha & \sin \alpha\\
        -\sin \alpha & \cos\alpha
      \end{pmatrix}.
\tag*{\qedhere}
  \]
\end{solution}


\begin{exercise}\label{1F1}\tiyuan{\parencite[2024]{dalianligong}}
  设实方阵 $A$ 可相似对角化 (如 $A$ 满足 $A^2=A$)。
  证明 $A$ 可分解为 $A=B C$, 其中 $B$ 实对称，$C$ 正定。
\end{exercise}

\begin{solution}
存在可逆实矩阵 $P$ 使得 $A=P^{-1} \diag (\lambda_{1}, \ldots, \lambda_{n}) P$. 故
\[
  A=P^{-1} \diag(\lambda_{1}, \ldots, \lambda_{n}) (P^{-1})^{\rT} \cdot P^{\rT} P.
\]
令 $B=P^{-1} \diag (\lambda_{1}, \cdots, \lambda_{n}) (P^{-1})^{\rT}$, 
$C= P^{\rT} P$, 则 $B$ 实对称，$C$正定，且 $A=B C$. 
\end{solution}


\begin{exercise}\label{20D}
  证明：方阵$A$的特征向量都是其伴随矩阵$A^*$的特征向量。
\end{exercise}

\begin{solution}
  \fangfa $A^*$ 可表为 $A$ 的多项式 (练习 \ref{080})，
  比如说 $A^*=f(A)$. 若 $(\lambda, v)$ 为 $A$的特征对，
  则 $A^*v=f(A)v=f(\lambda) v$. 因此 $v$ 是$A^*$的特征向量。


  \fangfa 
  设$A$是$n$阶矩阵。
  若$v$是属于特征值$\lambda\neq 0$的特征向量，那么对$Av=\lambda v$两边左乘$A^*$可得
  $(\det  A ) v=\lambda A^* v$, 故$A^* v=\lambda^{-1} (\det A) v$, 
  从而$v$是$A^*$的特征向量。
  考虑$0$是$A$的特征值的情形。此时$A$不可逆。
  如果$\rank A<n-1$, 那么$A^*=0$, 结论平凡。
  考虑$\rank A=n-1$. 
  设$V=\ker A$是特征值$0$的特征子空间。
  $\rank A=n-1$表明$\dim V=1$. 
  $A^*$与$A$可交换表明$V$是$A^*$的不变子空间。
  这样$V$是$A^*$的特征向量生成的子空间。
  因此$A$的属于特征值$0$的特征向量也是$A^*$的特征向量
  (实际上这样一个特征向量可由$A^*$的非零列给出)。
  %不难直接证明$\rank A=n-1$时$A^*$的非零列是$A^*$的特征向量。
\end{solution}



\begin{exercise}\label{203}
  设$H\in \bF^{n\times n}$为秩$1$方阵。证明
  \begin{enumerate}
    \item $H$的最小多项式$m(\lambda)$为$\lambda^2-(\tr H)\lambda$.
    \item $H$的特征值多项式$p(\lambda)$为$\lambda^{n-1}(\lambda-\tr H)$.
    \item $H$可对角化当且仅当$\tr H\neq 0$.
  \end{enumerate}
\end{exercise}

\begin{solution}
(1) 由练习~\ref{029}~和练习~\ref{02B}~知
$\lambda^2-(\tr H)\lambda$是$H$的零化多项式。
显然$\lambda, \lambda-\tr H$非$H$的最小多项式 (否则$H=0$或$(\tr H)E$)，
因此$H$的最小多项式为$\lambda^2-(\tr H)\lambda$.

(2) \fangfa  设$H=\alpha \beta^{\rT}$, 其中$\alpha, \beta\in \bF^{(n)}$.
那么由练习~\ref{025}~知
\[
\det (\lambda E-H)= \lambda^{n-1}(\lambda - \beta^T \alpha)=
\lambda^{n-1}(\lambda-\tr H).
\]

\fangfa  由于$\rank H=1$, 齐次线性方程组的解空间的维数为$n-1$.
这样$H$有$n-1$个特征值为$0$.
由于$H$的特征值之和等于$\tr H$, $H$还有个特征值为$\tr H$.

(3) 这是因为$\lambda^2-(\tr H)\lambda$没有重根当且仅当$\tr H\neq 0$.
\end{solution}


\begin{exercise}\tiyuan{\parencite[2024]{huanandaxue}}
设 $A$ 为复数域上的 $n$ 阶可逆矩阵，$A^{2}$ 在复数域上可相似对角化，
证明： $A$ 在复数域上可相似对角化。
\end{exercise}

\begin{solution}
设 $A$ 的 Jordan 标准形为 $J(\lambda_{1}, k_{1}) \oplus \cdots \oplus J(\lambda_{r}, k_{r})$. 
那么 $A^{2}$ 相似于
\[
  J(\lambda_{1}, k_{1})^{2} \oplus \cdots \oplus J(\lambda_{r}, k_{r})^{2},
\]
其中 
\[
  J(\lambda_i, k_i)^2=\begin{cases}
      \lambda_i^2,  & \text{若~} k_i=1, \\
    \begin{pmatrix}
      \lambda_i^2 & 2\lambda_i \\
      & \lambda_i^2
    \end{pmatrix}, & \text{若~} k_i=2, \\
\begin{pmatrix}
      \lambda_i^2 & 2\lambda_i & 1  \\
      & \ddots & \ddots & \ddots  \\
      & & \ddots & \ddots & 1 \\
      & & &  \ddots &  2\lambda_i \\
      & && & \lambda_i^2
    \end{pmatrix}, & \text{若~} k_i>2.
  \end{cases}
\]
由于 $A^{2}$ 可对角化，每个 $J(\lambda_{i}, k_{i})^{2}$ 可对角化，
因此其最小多项式为 $\lambda-\lambda_{i}^2$. 
由于 $\lambda_{i} \neq 0$, 只有 $k_{i}=1$.
故$A$ 的 Jordan标准形为对角矩阵，$A$ 可相似对角化。
\end{solution}

\begin{exercise}\tiyuan{\parencite[2024]{fudan}}
  证明： $n$ 阶复矩阵 $A$ 与所有的$A$ 的正次幂 $A^{k}$ ($k=1,2,\cdots$) 
  相似的充要条件是 $A$ 的特征多项式为 
$f(x)=(x-1)^{r} x^{n-r}$, 其中 $r=\rank(A)$. 
\end{exercise}

\begin{solution}
  ($\Leftarrow$) 若 $A$ 的特征多项式为 $f(x)=(x-1)^{r} x^{n-r}$, 其中 $r=\rank(A)$,
  则 $A$ 的Jordan标准形形如
  \[
    \diag(J(1,l_1),\cdots,J(1,l_s),0,\cdots,0),
  \]
  其中 $s\geqslant 0$, $0$就是数 $0$ (因为 $0$的几何重数等于代数重数). 
  对 $k\geqslant 1$, 由于 $J(1,l)$相似于 $J(1,l)^k$, 因此 $A$ 相似于 $A^k$.

  ($\Rightarrow$) 令 $\lambda$ 为 $A$ 的一个特征值。
  那么 $\lambda^k$ 为 $A^k$ 的特征值。这样 $\lambda,\lambda^2,\lambda^3,\cdots$
  都是 $A$ 的特征值。而 $A$ 只有有限个特征值，
  故对某对正整数 $k<l$ 有 $\lambda^k=\lambda^l$.
  因此 $\lambda=0$ 或者 $\lambda^m=1$ 
  (对某个正整数 $m$; 这样的最小的$m$称为$\lambda$的指数)。
  我们断言可能的非零特征值只能为$1$. 诚然，
  取 $k$ 为所有非零特征值的指数的最小公倍数。
  那么 $A^k$ 的非零特征值只有$1$. 既然 $A, A^k$相似，知 $A$ 的非零特征值只有$1$.
  另一方面，对充分大的正整数 $k$, 看Jordan标准形可知
  $A^k$ 的可能的特征值 $0$的几何重数等于$0$的代数重数。
  既然$A, A^k$相似，$A$ 的可能的特征值 $0$的几何重数 (即$n-r$) 等于代数重数，
  这样$1$的代数重数就是 $r$. 
  故 $A$ 的特征多项式为 $f(x)=(x-1)^{r} x^{n-r}$.
\end{solution}


\begin{exercise}
  令$V$为有限维向量空间，$\varphi\in \End(V)$.
  令$W\subset V$为子空间，且$\varphi$保持$W$ (即 $W$ 是 $\varphi$-不变的)。
  证明$\varphi$在$W$上的限制$\varphi|_W$的特征多项式整除$\varphi$的特征多项式。
\end{exercise}

\begin{solution}

  取$W$的基$\BB '=(v_1, \cdots, v_k)$, 并扩充为$V$的基$\BB =(v_1, \cdots, v_n)$. 
  令$\varphi|_W$在基$\BB '$下的矩阵为$B$, 
  那么$\varphi$在基$\BB $下的矩阵形如
  $\begin{pmatrix}
    B & C\\ & D
  \end{pmatrix}$. 这样$\varphi$的特征多项式为
  \[
    \det (\lambda E-B)\det (\lambda E-D),
  \]
  这是$\varphi|_W$的特征多项式$\det (\lambda E-B)$的倍。
\end{solution}


\begin{exercise}\label{04D}
  设$A\in \bF^{m\times n}, B\in \bF^{n\times m}$, 
  证明$AB$与$BA$有相同的非零特征值。若$m=n$, 证明$AB, BA$有相同的特征多项式。
\end{exercise}

\begin{solution}
  由练习~\ref{025}~有$\lambda^n \det (\lambda E-AB)=\lambda^m\det (\lambda E-BA)$.
  因此$\det (\lambda E-AB)$与$\det (\lambda E-BA)$有相同的非零根。
  这样$AB, BA$有相同的非零特征值。
  若$m=n$, 可进而得$\det (\lambda E-AB)=\det (\lambda E-BA)$. 
\end{solution}

\begin{exercise}
  设$A$为$n$阶实对称矩阵，$S$为$n$阶正定矩阵。证明$AS$的特征值都是实数。
\end{exercise}

\begin{solution}
  存在$P\in \GL_n(\bR)$使得$S=P^{\rT}P$. 
  由练习~\ref{04D}~知$AS=AP^{\rT}P$与$PAP^{\rT}$有相同的非零特征值。
  $PA P^{\rT}$是实对称矩阵，故其特征值都是实数。从而$AS$的也是。
\end{solution}


\begin{exercise}\label{050}
  设$A$是$n$阶可逆方阵，证明：
  \begin{enumerate}
\item 若$A$的特征多项式为$p(\lambda)=\lambda^n+a_{n-1}\lambda^{n-1}+\cdots+a_1\lambda +a_0$，
  则$A^{-1}$的特征多项式为
  \[
    f(\lambda)=\frac{1}{a_0} (\text{$p(\lambda)$的反多项式}) =\frac{1}{a_0}+\frac{a_{n-1}}{a_0} \lambda + \cdots + \frac{a_1}{a_0}\lambda^{n-1}+\lambda^n.
  \]
\item 若$A$有$n$个特征值为$\lambda_1, \cdots, \lambda_n$ (按代数重数记入)，则$A^{-1}$的全部特征值为$\lambda_1^{-1}, \cdots, \lambda_n^{-1}$.
  \end{enumerate}
\end{exercise}

\begin{solution}

  实际上，
  \begin{align*}
    f(\lambda)=|\lambda E-A^{-1}|
    &= |(-\lambda) (\lambda^{-1}E -A) A^{-1}|\\
    &= (-\lambda)^n |\lambda^{-1}E -A||A^{-1}|\\
    &= \frac{1}{(-1)^n|A|}\lambda^n p(\lambda^{-1})\\
    &= \frac{1}{a_0}+\frac{a_{n-1}}{a_0} \lambda + \cdots + \frac{a_1}{a_0}\lambda^{n-1}+\lambda^n.
  \end{align*}
  特别地，若$p(\lambda)$的所有根为$\lambda_1, \cdots, \lambda_n$ (比如基域是复数域时)， 
  则$f(\lambda)$的所有根为$\frac{1}{\lambda_1}, \cdots, \frac{1}{\lambda_n}$.
\end{solution}


\begin{exercise}
  设$A\in \bC^{n\times n}$. 证明$A$的特征多项式被$\tr A, \cdots, \tr A^n$决定了。
  特别地，若$A, B\in \bC^{n\times n}$满足$\tr A^i=\tr B^i$, 对$i=1, \cdots, n$, 
  那么$A, B$有相同的特征多项式。
\end{exercise}

\begin{solution}

  设$A$的全部特征值为$\lambda_1, \cdots, \lambda_n$. 
  $A$可以相似到对角线上是$\lambda_1, \cdots, \lambda_n$的上三角矩阵
  (比如取 $A$ 的上三角形式的Jordan标准形)，
  从而$A^k$可以相似到对角线上是$\lambda_1^k, \cdots, \lambda_n^k$的上三角矩阵。
  由于迹是相似不变量，
  $\tr A^k= \sum_{i=1}^n \lambda_i^k$. 
  利用Newton公式 (练习~\ref{05E})可知特征多项式
  $p(\lambda)=\prod_{i=1}^n(\lambda -\lambda_i)$被$\tr A, \cdots, \tr A^n$决定了。
\end{solution}

\begin{exercise}
设 $3$ 阶复方阵 $A$ 满足 $\tr A=1, \tr A^2=-3, \tr A^3=4$. 求 $A $ 的特征多项式。
\end{exercise}
\begin{solution}
设 $A$ 的特征多项式为 $\lambda^{3}+a_{1} \lambda^{2}+a_{2} \lambda+a_{3}$. 
由题设知 
\[
  \lambda_{1}+\lambda_{2}+\lambda_{3}=1, \quad
  \lambda_{1}^{2}+\lambda_{2}^{2}+\lambda_{3}^{2}=-3, \quad
  \lambda_{1}^{3}+\lambda_{2}^{3}+\lambda_{3}^{3}=4.
\]
由 Newton公式 (练习 \ref{05E}) 知
\[
  -a_{1}=1, \quad a_{2}=\frac{1}{2}\begin{vmatrix}1 & 1 \\ -3 & 1\end{vmatrix}=2, \quad
  -a_{3}=\frac{1}{6}\begin{vmatrix}1 & 1 & 0 \\ -3 & 1 & 2 \\ 4 & -3 & 1\end{vmatrix}=3.
\]
故 $A$ 的特征多项式为 $\lambda^3-\lambda^2+2\lambda-3$.
\end{solution}



\begin{exercise}
  设$A$是$n$阶方阵，其中$n\geqslant 3$. 
  令$p(\lambda)=\lambda^n+a_{n-1}\lambda^{n-1}+ \cdots + a_0$为$A$的特征多项式。
  证明
  \[
    a_{n-2}= \frac{1}{2}\left( (\tr A)^2-\tr A^2\right).
  \]
\end{exercise}

\begin{solution}
  设$A$的所有的复特征值为$\lambda_1, \cdots, \lambda_n$. 
  我们有
  \begin{align*}
    a_{n-2}&= \sum_{i\neq j} \lambda_i \lambda_j 
    = \frac{1}{2}\left( (\sum_{i=1}^n \lambda_i)^2 - \sum_{i=1}^n \lambda_i^{2} \right)\\
    &= \frac{1}{2}\left( (\tr A)^2- \tr A^2 \right).
    \tag*{\qedhere}
  \end{align*}
\end{solution}


\begin{exercise}\label{053}
    令$B=\begin{pmatrix}
        0& 1 \\
        & \ddots & \ddots \\
        & & \ddots & 1 \\
        1 & & & 0
      \end{pmatrix}\in \bC^{n\times n}$, 其中$n>1$. 求$B$的特征值和特征向量。
\end{exercise}


\begin{solution}
  我们来计算下$B$的特征多项式。我们有
  \begin{align*}
    |\lambda E- B| = \begin{vmatrix}
      \lambda & -1 \\
      & \ddots & \ddots \\
      & & \ddots & -1 \\
      -1 & & & \lambda
    \end{vmatrix}=\lambda^n-1.
  \end{align*}
  所以$B$有$n$个不同的特征值，恰为$n$个$n$次单位根$1, \zeta_n, \zeta_n^2, \cdots, \zeta_n^{n-1}$, 
  其中$\zeta_n=e^{\frac{2\pi i}{n}}$.
  设$z$是一个$n$次单位根，这个特征值的特征子空间是一维的。
  设$x=(x_1, \cdots, x_n)^{\rT}\in \bC^{(n)}$是属于这个特征值的特征向量，
  那么我们有$(z E- B)x=0$, 从而
  \[
    \begin{cases}
      z x_1-x_2=0\\
       zx_2-x_3=0\\
       \quad\vdots\\
       z x_{n-1} - x_n=0\\
       -x_1+z x_n=0.
    \end{cases}
  \]
  容易观察到$(x_1, \cdots, x_n)^{\rT}=(1, z^{1}, z^{2}, \cdots, z^{n-1})^{\rT}$是其一个解。
  由于特征子空间是一维的，这个解就构成了该齐次线性方程组的一个基础解系，从而特征值$z$的所有特征向量为
  $\{a(1, z^1, z^2, \cdots, z^{n-1})^{\rT}\mid 0\neq a\in \bC\}$.
\end{solution}




\begin{exercise}
\emph{循环矩阵}指形如
\[
\begin{pmatrix}
      a_0 & a_1 & a_2 & \cdots & a_{n-1} \\
      a_{n-1} & a_0 & a_1 & \cdots & a_{n-2} \\
      \vdots & \vdots & \vdots & & \vdots \\
      a_1 & a_2 & a_3 & \cdots & a_0
    \end{pmatrix}\in \bC^{n\times n}
\]
的复方阵，记为$C[a_0,\cdots,a_{n-1}]$. 
  \begin{enumerate}
\item 证明：$C[a_0,\cdots,a_{n-1}]=f(B)$, 其中$f(x)=a_0 + a_1 x+ \cdots + a_{n-1}x^{n-1}$, $B$是形如练习~\ref{053}~中定义的矩阵。
\item 令$\cC$为由循环方阵构成的$\bC^{n\times n}$的子集。
  证明
  $\cC$对加法、数乘、乘法封闭。\footnote{这样，$\cC$构成了$\bC^{n\times n}$的子代数。}
\item 证明：循环矩阵$C[a_0,\cdots,a_{n-1}]$的伴随矩阵是循环矩阵。
  若$C[a_0,\cdots,a_{n-1}]$可逆，其逆也是循环矩阵。
  \end{enumerate}
\end{exercise}

\begin{solution}
  (1) 通过对 $1\leqslant k<n$ 归纳，可直接计算出
      \[
        B^k=\begin{pmatrix}
        & E_{n-k}\\ E_k
      \end{pmatrix}.
    \]
由此易知$A=f(B)$. 

(2) 由(1)知$\cC=\{f(B)\mid f\in \bC[x]\}$. 
      这样$\cC$显然对加法、数乘、乘法封闭。

      (3) $C[a_0,\cdots,a_{n-1}]$ 的伴随矩阵和逆矩阵 (若可逆) 
      都是$C[a_0,\cdots,a_{n-1}]$的多项式
(分别见练习~\ref{080}~和注记~\ref{046})，故由(2)知断言成立。
\end{solution}


\begin{exercise}\label{1FA} 
  令复矩阵 $A=C[a_0,\cdots,a_{n-1}]$ 为一循环矩阵，
  $f(x)=a_0 + a_1 x+ \cdots + a_{n-1}x^{n-1}$,
  $\zeta_n=e^{\frac{2\pi i}{n}}$.
  \begin{enumerate}
      \item 证明：$A$可以相似对角化。
      \item 证明：$A$的行列式$\det A=f(z_1)f(z_2)\cdots f(z_n)$, 其中$z_k=\zeta_n^{k-1}$.
  \end{enumerate}
\end{exercise}


\begin{solution}
  (1) 令 $B$ 为 练习 \ref{053} 中矩阵。
  若$v\in \bC^{(n)}$是$B$的属于特征值$\lambda$的特征向量，
        即$Bv=\lambda v$, 那么易知$f(B)v=f(\lambda)v$, 
        即$f(\lambda)$是$A=f(B)$的特征值，$v$是相应的一个特征向量。
        令$\zeta_n=e^{\frac{2\pi i}{n}}$.
        既然$B$的所有特征值为$n$个$n$次单位根$z_k=\zeta_n^{k-1}$ ($1\leqslant k\leqslant n$)，
        相应的一个特征向量为$v_k=(1,z_k,\cdots,z_k^{n-1})^{\rT}$,
        我们有$v_k$是$A=f(B)$的特征向量，属于特征值$f(z_k)$. 
        %利用Vandermonde行列式我们知$v_1, \cdots, v_n$拼成的方阵的行列式为
        %\[
        %  \det\begin{pmatrix}
        %    v_1 & v_2 & \cdots & v_n
        %  \end{pmatrix}=\prod_{1\leqslant j<i \leqslant n}(z_i-z_j)\neq 0
        %\]
        $v_1, \cdots,v_n$作为$B$的属于不同特征值的特征向量是线性无关的，
        因此$A$可相似对角化。

        (2) 由(1)知$A$的所有$n$个特征值为$f(z_1), f(z_2), \cdots, f(z_n)$, 其中$z_k=\zeta_n^{k-1}$,
        所以$\det A=\prod_{i=1}^nf(z_i)$.
\end{solution}



\begin{exercise}
  证明所有的$n$阶循环复矩阵可同时对角化。
\end{exercise}

\begin{solution}
  在基$(1,\varepsilon,\cdots,\varepsilon^{n-1})^{\rT}, \cdots, (\varepsilon^{n-1}, \varepsilon^n, \cdots, \varepsilon^{2n-2})^{\rT}$下所有循环复矩阵都是对角的。
\end{solution}






\begin{exercise}
 令$V$是有限维$\bF$-向量空间，$\sA\in \End(V)$. 
 \begin{enumerate}
   \item 对$v\in V$, $v$相对于$\sA$的最小多项式$m_v(\lambda)$整除$\sA$的最小多项式。
     这里$v$相对于$\sA$的最小多项式$m_v(\lambda)$指$\sA|_{\bF[\sA]v}$的最小多项式。
   \item 证明存在$v\in V$使得$v$相对于$\sA$的最小多项式等于$\sA$的最小多项式。
     \end{enumerate}
\end{exercise}

\begin{solution}
  (1) $\sA$ 的最小多项式 $m(\lambda)$ 零化 $\sA$, 当然也零化 $\sA|_{\bF[\sA]v}$.
  因此 $v$相对于$\sA$的最小多项式$m_v(\lambda)$整除 $m(\lambda)$.

  (2) 对$v\in V$, 由(1)知$m_v(\lambda)$整除$\sA$的最小多项式$m(\lambda)$.
      而$m(\lambda)$只有有限个首一因子，故$V$中元素的最小多项式只有有限多个，
      记为$m_1(\lambda), \cdots, m_k(\lambda)$.
      令$V_i=\ker m_i(\sA)$. 那么$V=\cup_{i=1}^k V_i$.
      由于$V$不能被有限个真子空间覆盖 (见练习~\ref{0C4})，
      存在指标$i$使得$V_i=V$.
      这样$m_i(\lambda)=m(\lambda)$.
\end{solution}




\begin{exercise}
  设$A, B\in \bC^{n\times n}$. 证明或证伪下面的论述：
  \begin{enumerate}
    \item 若$A, B$可对角化则$A+B$亦可。
    \item 若$A, B$可对角化则$AB$亦可。
    \item 若$A^2=A$则$A$可对角化。
    \item 若$AB$可对角化且可逆则$BA$亦可。
  \end{enumerate}
\end{exercise}

\begin{solution}
  (1) 否。如$A=\begin{pmatrix}
        1 & 1\\ & -1
      \end{pmatrix}, B=\begin{pmatrix}
        -1 \\ & 1
      \end{pmatrix}$.

      (2) 否。如$A=\begin{pmatrix}
        1 & 1\\ & -1
      \end{pmatrix}, B=\begin{pmatrix}
        -1 \\ & 1
      \end{pmatrix}$.

      (3) 是。$A$的最小多项式没有重根。

      (4) 是。若$AB$可逆，则$A, B$都可逆。此时$BA=A^{-1}(AB)A$, 所以$BA$与$AB$相似。
      既然$AB$可对角化，$BA$亦可。
\end{solution}


\begin{exercise}\label{206}
  设$A\in \bQ^{n\times n}$, $f\in \bQ[x]$为次数大于$1$的不可约多项式，且$f(A)=0$.
  请问$A$在有理数域上可否对角化？复数域上又如何？
\end{exercise}

\begin{solution}
  我们知道$A$可对角化当且仅当其最小多项式可分解为若干两两不同的首一的$1$次因子的乘积。
  由于$f$在$\bQ$上不可约，$f$为$A$在$\bQ$上的最小多项式。$f$不可约表明$A$不能对角化。
  若基域是复数域，$f$不可约表明$f$与$f'$互素，从而$f\in \bC[x]$没有重根。
  $A$的最小多项式整除$f$, 因此也没有重根。这样$A$在复数域上可对角化。
\end{solution}




\begin{exercise}
  设$A\in \bC^{n\times n}$. 证明$A$可对角化当且仅当对任意的$f\in \bC[x]$, $f(A)$幂零蕴含了$f(A)=0$.
\end{exercise}

\begin{solution}

  ($\Rightarrow$) 若$A$可对角化，则$A$的最小多项式$m(\lambda)$没有重根。
  $f(A)$幂零表明$m(\lambda) \mid f(\lambda)^k$, 对某个正整数$k$.
  由于$m(\lambda)$没有重根，我们有$m(\lambda)\mid f(\lambda)$. 这样$f(A)=0$.

  ($\Leftarrow$) 容易发现$m(\lambda)$不可能有重根。
\end{solution}




\begin{exercise}
  设$B_1, \cdots, B_k$方阵。
  证明准对角矩阵$B=B_1\oplus \cdots \oplus B_k$对角化当且仅当每个$B_i$可对角化。
\end{exercise}


\begin{solution}

  \fangfa $B$可对角化当且仅当$B$的初等因子都是一次因子，当且仅当
  每个$B_i$的初等因子都是一次因子 
  (因为 $B$ 的初等因子是 $B_1,\cdots,B_k$的所有初等因子合并而得)，
  当且仅当每个$B_i$可对角化。

  \fangfa   ($\Leftarrow$) 若$P_i^{-1}B_iP_i$是对角阵，
  那么$P^{-1}BP$是对角矩阵，其中$P=P_1\oplus \cdots \oplus P_k$.
  ($\Rightarrow$) 若$B=B_1\oplus \cdots \oplus B_k$可对角化，
  那么$B$的最小多项式可分解为互异的首一一次因子的乘积。
  而$B$的最小多项式是这些$B_i$的最小多项式的首一最小公倍，
  故每个$B_i$的最小多项式都是互异的首一一次因子的乘积。这样$B_i$可对角化。
\end{solution}


\begin{exercise}
  设$V$为有限维复向量空间，$T$为$V$上的线性变换。
  称$T$完全可约，若对于任意的$T$-不变子空间$U$, 存在$T$-不变子空间$W$使得$V=U\oplus W$. 
  证明$T$完全可约当且仅当$T$可对角化。
\end{exercise}


\begin{solution}
($\Rightarrow$) 令 $v_{1}$ 为 $T$ 的一个特怔向量，$U_{1}=\Span v_{1}$. 
由 $T$ 完全可约知存在 $T$-子空间 $W_{1}$ 使得 $V=U_{1} \oplus W_{1}.$
$T_{W_{1}}$ 有一特征向量 $v_{2}$. 显然 $v_{1}, v_{2}$ 线性无关。
令 $U_{2}=\Span(v_{1}, v_{2})$. 
存在 $T$-子空间 $W_{2}$ 使得 $V=U_{2} \oplus W_{2}$. 
再考虑 $T |_{ W_{2}}$,\ldots 不断如此考虑下去，可得线性无关的 $n$ 个特征向量。
故$T$ 可对角化。

($\Leftarrow$) $T$ 可对角化，故$V$ 是 $T$的特征子空间的直和。
令 $U$ 为 $T$-子空间。$T|_U$ 的最小多项式整除 $T$ 的最小多项式，从而也没有重根，
故 $T|_U$ 可对角化。这样存在$U$ 的由$T|_U$的特征向量 (当然也是 $T$ 的特征向量) 构成的基 
$\BB_{1}=(v_{1}, \ldots, v_{r} )$. 若 $\lambda$ 是 $T$ 的特征值，
将 $\BB_{1}$ 中包含的属于 $\lambda$ 的特征向量扩充为 
特征子空间 $V_{\lambda}$ 的基，并把扩充的向量加入 $\BB_1$ 中。
最终可得线性无关的 $n$ 个特征向量 $\BB=(v_{1}, \ldots, v_{r}, v_{r+1}, \ldots, v_{n})$.
令 $W=\Span(v_{r+1}, \ldots, v_{n})$, 则 $W$ 为 $T$-不变，且 $V=U \oplus W$. 
\end{solution}




\begin{exercise}\label{0E2}
  设$A\in \bF^{n\times n}$, $\tr A=0$. 证明
\begin{enumerate}
  \item $A$ 相似于一个形如 $\begin{pmatrix}
      0 & \beta^{\rT}\\
      \alpha & A_1
    \end{pmatrix}$的矩阵。
\item $A$相似于一个对角线上都是$0$的方阵。
\item 存在 $n$ 阶方阵 $X, Y$ 使得 $A=X Y-Y X$. 
\end{enumerate}
\end{exercise}

\begin{solution}
  (1) 
  可设$A\neq 0$. 此时$A$非纯量矩阵，故存在$0\neq v\in \bF^{(n)}$使得$v, Av$线性无关 
  (练习 \ref{0CB})。
  把$v_1=v, v_2=Av$扩充为$\bF^{(n)}$的基$(v_1, v_2, \cdots, v_n)$，
  线性变换$A$在该基下的矩阵形如
  $\begin{pmatrix}
    0 & \beta^{\rT}\\
    \alpha & A_1
  \end{pmatrix}$.
  令 $P=\begin{pmatrix}
    v_1 & \cdots & v_n
  \end{pmatrix}$, 则 $P$ 为可逆矩阵，且
  \[
    P^{-1} A P=
    \begin{pmatrix}
      0 & \beta^{\rT}\\
      \alpha & A_1
  \end{pmatrix}.\]

  (2)  我们对阶$n$归纳来证明。$n=1$时没什么可证。令 $n>1$.
  由 (1) 知存在 $P_1\in \GL_n(\bF)$使得
  \[
    P_1^{-1} A P_1=
    \begin{pmatrix}
      0 & \beta^{\rT}\\
      \alpha & A_1
  \end{pmatrix},\]
  且$\tr A_1=0$. 
  由归纳假设知存在$P_2\in \GL_{n-1}(\bF)$使得$P_2^{-1} A P_2$为一个对角线上都是$0$的方阵。
  令$P=P_1\diag(1, P_2)$. 我们有
  \begin{align*}
    P^{-1} A P &=  \begin{pmatrix}
      1 \\ & P_2
    \end{pmatrix}^{-1} P_1^{-1} A P_1 \begin{pmatrix}
      1 \\ & P_2
    \end{pmatrix} \\
    &=  \begin{pmatrix}
      1 \\ & P_2
    \end{pmatrix}^{-1} \begin{pmatrix}
      0 & \beta^{\rT}\\
      \alpha & A_1
  \end{pmatrix} \begin{pmatrix}
      1 \\ & P_2
    \end{pmatrix} \\
    &=  \begin{pmatrix}
      0 & \beta^{\rT} P_2\\
      P_2^{-1} \alpha & P_2^{-1} A_1 P_2
    \end{pmatrix},
  \end{align*}
是一个对角线上都是$0$的矩阵，得证。

  (3) 我们对阶 $n$ 归纳。由 (1) 知存在$P\in \GL_n(\bF)$使得
  \[
    P^{-1} A P=
    \begin{pmatrix}
      0 & \beta^{\rT}\\
      \alpha & A_1
  \end{pmatrix}.\]
  只用证明 $\begin{pmatrix}0 & \alpha^{\rT} \\ \beta & A_{1}\end{pmatrix}$ 
为一个交换子 $[X, Y]=X Y-Y X$; 此时 
\[
A=P\begin{pmatrix}0 & \alpha^{\rT} \\ \beta & A\end{pmatrix} P^{-1}= 
(PX P^{-1})(P Y P^{-1})-(P Y P^{-1})(P X P^{-1}).
\]
显然 $\tr A_1=0$, 故由归纳假设知 $A_{1}=X_{1} Y_{1}-Y_{1} X_{1}$ 为交换子。
注意到可替换 $X_{1}$ 为 $X_{1}+\varepsilon E$, 故可设 $X_{1}$ 可逆。令
\[
X=\begin{pmatrix}
0 & 0 \\
0 & X_{1}
\end{pmatrix}, \quad Y=\begin{pmatrix}
0 & -\alpha^{\rT} X_{1}^{-1} \\
X^{-1}\beta & Y_{1}
\end{pmatrix}.
\]
那么  $X Y-Y X=\begin{pmatrix}0 & \alpha^{\rT} \\ \beta & A_{1}\end{pmatrix}$, 证毕。
\end{solution}


\begin{exercise}\label{0D0}
  设$A\in \bF^{n\times n}$的特征多项式 $p(\lambda)$可分解为
  $p(\lambda)=\prod_{i=1}^n (\lambda-\lambda_i)$.
  \begin{enumerate}
    \item 证明$A$可以相似上三角化为形如
      \[
        \begin{pmatrix}
        \lambda_1 & * & \cdots & * \\
        & \lambda_2 & \cdots & *\\
        & & \ddots  & \vdots \\
        & & & \lambda_n
      \end{pmatrix}，
    \]
    即存在可逆矩阵$P$使得$P^{-1}AP$形如该上三角矩阵。
  \item 设 $g(\lambda)\in \bF[\lambda]$. 证明$g(A)$的全部特征值 (按重数记入)
    为$g(\lambda_1), \cdots, g(\lambda_n)$. 
    特别地，$\det g(A)=\prod_{i=1}^n g(\lambda_i)$.
  \end{enumerate}
\end{exercise}

\begin{solution}
  (1) 当然取 $A$ 的 (上三角形式的) Jordan标准形就行。下面是一个直接的证明。
  我们对$n$归纳。$n=1$的情形显然。
      考虑$n>1$. 取$\lambda_1$的特征向量$\alpha_1$. 将其扩充为$\bF^{(n)}$的基。
      那么$A$ (作为$\bF^{n\times n}$上的线性变换)在此基下的矩阵形如$\begin{pmatrix}
        \lambda_1 & * \\
        & A'
      \end{pmatrix}$. 这样$A'$的特征多项式为$\prod_{i=2}^n (\lambda-\lambda_i)$. 
      由归纳假设知存在$\bF^{(n-1)}$的基使得$A'$在该基下的矩阵形如
$\begin{pmatrix}
        \lambda_2 & * & \cdots & * \\
        & \lambda_3 & \cdots & *\\
        & & \ddots  & \vdots \\
        & & & \lambda_n
      \end{pmatrix}$.
      从而存在可逆矩阵$P$使得
      \[
        P^{-1}AP=\begin{pmatrix}
        \lambda_1 & * & \cdots & * \\
        & \lambda_2 & \cdots & *\\
        & & \ddots  & \vdots \\
        & & & \lambda_n
      \end{pmatrix}.
    \]

    (2) 存在可逆矩阵$P$使得$P^{-1}AP=\begin{pmatrix}
        \lambda_1 & * & \cdots & * \\
        & \lambda_2 & \cdots & *\\
        & & \ddots  & \vdots \\
        & & & \lambda_n
      \end{pmatrix},$ 进而对非负整数$k$有
      \[
        P^{-1}A^kP=\begin{pmatrix}
        \lambda_1^k & * & \cdots & * \\
        & \lambda_2^k & \cdots & *\\
        & & \ddots  & \vdots \\
        & & & \lambda_n^k
      \end{pmatrix}.
      \]
      这样对$g(\lambda)\in  \bF[\lambda]$有
      \[
        P^{-1}g(A)P=\begin{pmatrix}
          g(\lambda_1) & * & \cdots & * \\
          & g(\lambda_2) & \cdots & *\\
        & & \ddots  & \vdots \\
        & & & g(\lambda_n)
      \end{pmatrix}.
      \]
      这样$g(A)$的特征值全体为$g(\lambda_1), \cdots, g(\lambda_n)$, 进而，
      $\det g(A) =\prod_{i=1}^n g(\lambda_i).$
\end{solution}

\begin{exercise}\label{06A}
  设$g(\lambda)\in \bF[\lambda]$, 
  且$p(\lambda)$为$A\in \bF^{n\times n}$的特征多项式。
  证明$g(A)$是可逆矩阵当且仅当$g$与$p$互素，
  且此时$g(A)$的逆可表为$A$的多项式。
\end{exercise}


\begin{solution}
  可设 $g\neq 0$. 令$g(\lambda)$ 在复数域上的分解为
 $g(\lambda)=c\prod_{i=1}^m(\lambda-\mu_i)$ (其中 $c\neq 0$). 
  那么 $g(A)=c\prod_{i=1}^m (A-\mu_i E)$.
  $g(A)$ 可逆当且仅当 所有 $A-\mu_i E$ 可逆，
当且仅当 任一个 $\mu_i$ 不是 $A$ 的特征值，
当且仅当 任一个$\mu_i$ 不是 $p(\lambda)$ 的根，
当且仅当 $g,p$ 互素。

若$g, p$互素，则存在多项式$u(\lambda), v(\lambda)\in \bF[\lambda]$使得$up+vg=1$.
  这样$u(A)p(A)+v(A)g(A)=E$. 
  由Hamilton-Cayley定理知$p(A)=0$, 所以$v(A)g(A)=E$. 
  这样$g(A)^{-1}=v(A)$.
\end{solution}



\begin{exercise}\label{07B}
  设$A, B\in \bC^{n\times n}$, 且$A, B$可交换。
  证明$A, B$可同时上三角化，即存在可逆矩阵 $P$使得
  $P^{-1}AP, P^{-1}BP$同时是上三角的。
\end{exercise}


\begin{solution}

我们对阶$n$归纳。由于$A, B$可交换，它们有公共的特征向量$v$
(练习 \ref{07D}).
  将$v$延拓为$\bC^{(n)}$的基，$A, B$在该基下的矩阵分别形如
  \begin{align*}
    \begin{pmatrix}
      a & \alpha \\
      & A'
    \end{pmatrix},\quad 
    \begin{pmatrix}
      b & \beta\\
      & B'
    \end{pmatrix}.
  \end{align*}
  $A, B$可交换表明$A', B'$可交换。由归纳假设知$A', B'$可同时上三角化。
  从而$A, B$可同时上三角化。
\end{solution}




\begin{exercise}\label{0D2}
令 $A \in \bF^{n \times n}, B\in \bF^{m\times m}$. 考虑线性变换 
\[
  \begin{aligned}
    \sA &\colon  \bF^{n \times m} \rightarrow \bF^{n \times m}, X \mapsto A X, \\
    \sB &\colon  \bF^{n \times m} \rightarrow \bF^{n \times m}, X \mapsto XB.
\end{aligned}
\]
证明
\begin{enumerate}
  \item $\sA $ 与 $A$ 有相同的特征值，$\sB$ 与 $B$ 有相同的特征值。
  \item $A$ 的最小多项式整除 $\sA$的最小多项式；
    若 $n\leqslant m$, 则 $\sA$ 的最小多项式就是 $A$ 的最小多项式。
$B$ 的最小多项式整除 $\sB$的最小多项式；
    若 $n\geqslant m$, 则 $\sB$ 的最小多项式就是 $A$ 的最小多项式。
    \end{enumerate}
  \end{exercise}
  \begin{solution}
    (1)
    只证明关于 $A, \sA$ 的断言，可类似地证明关于$B, \sB$ 的断言。

    \fangfa $\sA$ 在 $\bF^{n\times m}$ 的基 $e_{11},\cdots,e_{n1}$, $\cdots, \cdots,$
    $e_{1m},\cdots,e_{nm}$ 下的矩阵为 $mn$阶矩阵 $\diag(A,\cdots,A)$.
    故 $\sA$ 的特征多项式为 $p_A^m$, 其中 $p_A$ 为 $A$的特征多项式。
    由此可知，$\sA $ 与 $A$ 有相同的特征值。

   \fangfa 若 $\lambda$ 为$\sA$的特征值，则存在 $0 \neq X \in \bF^{n \times m}$ 使得 
    $A X=\lambda X$. 设 $X$ 的第 $i$ 列 $X_i$ 非零，
    则由 $A X_{i}=\lambda X_{i}$ 知 $\lambda$ 为 $A$ 的特征值。
反过来，设 $\lambda$ 为 $A$ 的特征值，$\alpha$ 为相应的一个特征向量。
令 
\[
X=\begin{pmatrix} \alpha & 0 & \cdots & 0\end{pmatrix} \in \bF^{n \times m}.
\]
则 $\sA X=A X=\lambda X$. 故 $X$ 为 $\sA$ 的特征值。
这就证明了$\sA$ 与 $A$ 有相同的特征值。


(2) 显然对任意的多项式 $f(x)$ 有 $f(\sA)X=f(A)X$, 对任意的 $X\in\bF^{n\times m}$. 
因此，若 $f(A)=0$, 则 $f(\sA)=0$; 特别地， $A$ 的最小多项式零化 $\sA$.
因而 $\sA$ 的最小多项式整除 $A$ 的最小多项式。
若 $n\leqslant m$, 取 $X=\begin{pmatrix}
  E_n & 0
\end{pmatrix}$. 这样 $f(\sA)=0$ 蕴含了 $0=f(\sA)X=f(A)X$, 故 $f(A)=0$.
因此 $\sA$ 的最小多项式也零化 $A$. 这样 $A, \sA$的最小多项式相互整除从而相等。
关于 $B, \sB$ 的论断可类似地验证。
\end{solution}





\begin{exercise}\label{04E}\tiyuan{\parencite[2024]{huananligong}}
  设同阶方阵 $A, B, C$ 满足 $A C=C B$. 证明： 若 $\rank(C)=r$, 
  则$A, B$ 的特征多项式有 $r$ 次公因式.
\end{exercise}

\begin{solution}
存在可逆的 $P, Q$ 使得 $P C Q=\begin{pmatrix}E_r \\ & 0\end{pmatrix}$. 
我们有 $P A P^{-1} \cdot P C Q=P C Q \cdot Q^{-1} B Q$.
令 
\[
  P A P^{-1}=\begin{pmatrix}A_{1} & A_{2} \\ A_{3} & A_{4}\end{pmatrix}, \quad
  Q^{-1} B Q=\begin{pmatrix}B_{1} & B_{2} \\ B_{3} & B_{4}\end{pmatrix},
\]
其中 $A_1, B_1$ 为 $r$ 阶方阵。
代入上式得
\[
\begin{pmatrix}
A_{1} & A_{2} \\
A_{3} & A_{4}
\end{pmatrix}\begin{pmatrix}
E_{r} & 0 \\
0 & 0
\end{pmatrix}=\begin{pmatrix}
E_{r} & 0 \\
0 & 0
\end{pmatrix}\begin{pmatrix}
B_{1} & B_{2} \\
B_{3} & B_{4}
\end{pmatrix},
\]
亦即 $\begin{pmatrix}A_{1} & 0 \\ A_{2} & 0\end{pmatrix}=
\begin{pmatrix}B_{1} & B_{2} \\ 0 & 0\end{pmatrix}$. 
故 $A_{1}=B_{1}, A_{3}=0, B_{2}=0$. 
这样 
\[
\begin{aligned}
  \det(\lambda E-A_{1})&= \det(\lambda E-B_{1}), \\
  \det(\lambda E-A)&= \det(\lambda E-P A P^{-1})=\det (\lambda E-A_1)\det (\lambda E-A_4),\\
  \det(\lambda E-B)&= \det(\lambda E-P B P^{-1})=\det (\lambda E-B_1)\det (\lambda E-B_4).
\end{aligned}
\]
因此 $A, B$ 的特征多项式有 $r$ 次公因子 $\det(\lambda E-A_{1}) = \det(\lambda E-B_{1})$.
\end{solution}




\begin{exercise}[Sylvester]\label{04F}
  设 $A\in \bC^{n\times n}, B\in \bC^{m\times m}, C\in \bC^{n\times m}$.  证明：
  \begin{enumerate}
    \item 矩阵方程$AX=XB$有唯一零解当且仅当$A, B$无公共特征值。
    \item   矩阵方程 $AX-XB=C$ 有唯一解当且仅当 $A, B$ 无公共特征值。
  \end{enumerate}
\end{exercise}

\begin{solution}
  (1) ($\Leftarrow$) %\fangfa 
  令 $A, B$ 的特征多项式分别为 $p_A, p_B$.
  若$AX=XB$, 则$A^kX=XB^k$, 进而$f(A)X=Xf(B)$, 对任意的$f\in \bC[x]$. 
  特别地，$p_A(A)X=Xp_A(B)$. 若$A, B$无公共特征值，
  则$p_A$与$p_B$互素，$p_A(B)$可逆 (练习 \ref{06A})，从而$X=0$.
\iffalse
  \fangfa  设$Y$是$AX=XB$的一个非零解，即 $Y\neq 0$且$AY=YB$.
  若$B$有个特征向量$v$ (设相应的特征值为$\lambda$)使得$Yv\neq 0$, 
  那么$A(Yv)=YBv=\lambda Yv$, 因此$\lambda$是$A$的特征值。
  若$B$的所有特征向量$v$都满足$Yv=0$, \ldots
  得考虑广义特征向量，跟第一种方法差不多。
\fi

  ($\Rightarrow$) %\fangfa 
  我们反证，假设 $A, B$ 有公共的特征值 $\lambda$. 
    %注意到对任意的 $a\in \bC$, $AX=XB$ 等价于 $(A+ a E)X = X(B+aE)$; 我们可以假设 $\lambda\neq 0$.
    我们知道 $B$ 与 $B^{\rT}$ 有相同的特征多项式。所以，$B^{\rT}$ 有特征值 $\lambda$. 
    取非零向量$v, w$使得 $A v = \lambda v, B^{\rT}w= \lambda w.$
    再令 $X=vw^{\rT}$. $v, w$ 非零表明 $X\neq 0$. 此时我们有
    \[ AX=Avw^{\rT} = \lambda vw^{\rT}= v(\lambda w^{\rT})=v w^{\rT} B = XB. \]
    这样 $AX=XB$ 有个非零解，与假设矛盾了。
    (\emph{另外}，也可应用 练习 \ref{04E}。)
\iffalse
    \fangfa  设$AX=XB$有个非零解，且标准型为$\begin{pmatrix}
      E_r \\ & 0
    \end{pmatrix}$, 其中$r>0$. 
    通过替换$A, B$为相似的矩阵，我们可设$X=\begin{pmatrix}
      E_r \\ & 0
    \end{pmatrix}$.
    对$A, B$分块并从等式
    \[
      \begin{pmatrix}
        A_1 & A_2\\
        A_3 & A_4
      \end{pmatrix}\begin{pmatrix}
         E_r \\ & 0
       \end{pmatrix}=\begin{pmatrix}
         E_r \\ & 0
       \end{pmatrix}\begin{pmatrix}
         B_1 & B_2\\
         B_3 & B_4
       \end{pmatrix}
    \]
    可得$A_1=B_1, A_3=B_2=0$.
    这样$A_1$的特征值是$A$的特征值，$B_1$的特征值为$B$的特征值，故$A, B$有公共的特征值。
  \fi

    (2) 考虑线性变换
    \[
      \varphi\colon \bC^{n\times m}\rightarrow \bC^{n\times m}, X\mapsto AX-XB.
    \]
    $AX-XB=C$有唯一解当且仅当
    $\varphi$是可逆当且仅当$\varphi$是单射，而这反过来由(1)可知当且仅当$A,B$没有公共特征值。
\end{solution}





\begin{exercise}\label{0D6}\tiyuan{\parencite[2024]{huananshida}}
记 $\bC^{n \times m}$ 为复数域上的 $n \times m$ 矩阵空间，
记 $\sigma(M)$ 为复方阵 或有限维复线性空间上的线性变换 $M$ 的所有特征值的集合。
令 $A \in \bC^{n \times n}, B \in \bC^{m \times m}$.
定义 $\bC^{n \times m}$ 上的线性变换
\[
  \sT\colon \bC^{n \times m}\rightarrow \bC^{n \times m},\quad X\mapsto A X+X B.
\]
证明 $\sigma(\sT)=\{\lambda+\mu\mid \lambda\in \sigma(A), \mu\in \sigma(B)\}$.
\end{exercise}

\begin{solution}
\fangfa  对 $\tau\in \bC$, $\tau$ 为 $\sT$ 的特征值
当且仅当 $A X+X B=\tau X$ 有非零解，当且仅当 $(A-\tau E) X+X B=0$ 有非零解，
当且仅当 $A-\tau E, -B$ 有公共的特征值 (由练习 \ref{04F})，
当且仅当存在 $A, B$ 的特征值 $\lambda,\mu$ 使得 $\lambda-\tau=-\mu$, 
即 $\tau=\lambda+\mu$. 故 $\sigma(\sT)=\sigma(A)+\sigma(B)$. 

\fangfa 将 $\bC^{n\times m}$ 上的左乘一矩阵$A$给出的线性变换 $X\mapsto AX$
记作 $\psi_A$, 右乘一矩阵$B$给出的线性变换  $X\mapsto XB$ 记作 $\varphi_B$.
令 $\sigma(A)=\{\lambda_1,\cdots,\lambda_n\}$,
$\sigma(B)=\{\mu_1,\cdots,\mu_m\}$.
存在可逆矩阵 $P$ 使得 
\[
  B'\coloneq P^{-1}BP = \begin{pmatrix}
\mu_1 & * & \cdots & * \\
& \mu_2 & \cdots & * \\
& & \ddots & \vdots \\
& && \mu_m
\end{pmatrix}
\]
为上三角矩阵 (比如取 $B'$ 为 Jordan标准形)。
令 $\sT' = \varphi_P\circ \sT\circ \varphi_{P^{-1}}$. 
由于 $\varphi_{P^{-1}}$ 是 $\varphi_P$ 的逆，在给定的基下，
$\sT'$, $\sT$的矩阵是相似的。故要求 $\sigma(\sT)$, 只用求 $\sigma(\sT')$. 
我们有
\[
\begin{aligned}
  \sT'(X) &= \varphi_P\circ \sT\circ \varphi_{P^{-1}}(X) = \varphi_P\circ \sT(XP^{-1}) \\
&= \varphi_P(AX P^{-1} + XP^{-1}B) = AX + XP^{-1}BP \\
&= AX + XB'.
\end{aligned}
\]
令 $B' = (b_{ij})$. $\psi_A, \varphi_{B'}$ 在 $\bC^{n\times m}$ 的基
  \[
    e_{11}, e_{21},\cdots, e_{n1}, e_{12}, e_{22}, \cdots, e_{n2}, \cdots, e_{1m}, e_{2m}, \cdots, e_{nm}
  \]
  下的矩阵分别为
  \[
    \begin{pmatrix}
      A\\ &  A \\ & & \ddots \\ & & &  A
    \end{pmatrix},\quad 
    \begin{pmatrix}
      b_{11} E_n & b_{21} E_n & \cdots & b_{m1} E_n\\
      b_{12} E_n & b_{22} E_n & \cdots & b_{m2} E_n\\
      \vdots & \vdots  & & \vdots \\
      b_{1m} E_n & b_{2m} E_n & \cdots & b_{mm} E_n
    \end{pmatrix}=\begin{pmatrix}
      \mu_1 E_n &  &  & \\
       *& \mu_2 E_n &  & \\
      \vdots & \vdots  & \ddots  &  \\
      * & * & \cdots & \mu_m E_n
    \end{pmatrix}.
  \]
  从而 $\sT'$ 在该基下矩阵形如
\[
\begin{pmatrix}
A + \mu_1 E & &  &  \\
* & A + \mu_2 E &  &  \\
\vdots &\vdots & \ddots &  \\
* & * & \cdots & A + \mu_m E
\end{pmatrix},
\]
$\sT'$ 的特征多项式为
\[
  p(\lambda) = \prod_{i = 1}^{m} \det((\lambda - \mu_i)E - A) = 
  \prod_{i = 1}^{m} \prod_{j = 1}^{n} (\lambda - (\mu_i+ \lambda_j )).
\]
故 $\sigma(\sT) = \sigma(\sT') = \sigma(A) + \sigma(B)$. 
\end{solution}
%\begin{remark}
% 这题实际上与练习 \ref{04F} 等价。
% 如果可以用其他方法证明这题 (避免循环论证)，
% 那么也可反过来应用此题的结论证明 练习 \ref{04F}。
%\end{remark}

\begin{exercise}\label{01B}
  设$A\in \bF^{n\times n}, B\in \bF^{m\times m}$. 定义线性变换
  $\sT\colon \bF^{n\times m}\rightarrow \bF^{n\times m}, X\mapsto AX+XB$. 
  若 $A, B$可对角化，证明：
\begin{enumerate}
\item $\sT$可对角化。
\item $\bF^{n\times m}=\mathscr{T}^{-1}(0) \oplus \sT V$.
\end{enumerate}
\end{exercise}

\begin{solution}
  由练习 \ref{090} 知 (2) 可由 (1) 得。
  故 只用证明 $\sT$可对角化。
  将 $\bF^{n\times m}$ 上的左乘一矩阵$A$给出的线性变换 $X\mapsto AX$
  记作 $\psi_A$, 右乘一矩阵$B$给出的线性变换  $X\mapsto XB$ 记作 $\varphi_B$.

  \fangfa
  若$A$可对角化，则$A$的最小多项式是互异的首一一次因子的乘积。
  由练习 \ref{0D2} 知
  $\psi_A$ 的最小多项式整除$A$的最小多项式，从而也是互异的首一一次因子的乘积。
  因此$\psi_A$可对角化。
  类似地，$B$的最小多项式零化$\varphi_B$, $B$可对角化时$\varphi_B$也可对角化。
  又显然有 $\psi_A, \varphi_B$可交换，
  由练习~\ref{0A8}~知两个线性变换可同时对角化。
  这样 $\sT=\psi_A+\varphi_B$可对角化。

  \fangfa 取可逆矩阵 $P, Q$ 使得
  \[
  \begin{aligned}
      A' \coloneq P^{-1}AP = \diag(\lambda_1,\cdots,\lambda_n),\quad
        B' \coloneq Q^{-1}BQ = \diag(\mu_1,\cdots,\mu_m).
      \end{aligned}
\]
  令 
  \[
    \sT'=\psi_{P^{-1}}\circ \varphi_Q\circ \sT\circ \varphi_{Q^{-1}}\circ \psi_P.
  \]
  由于 $\psi_{P^{-1}}, \varphi_{Q^{-1}}$ 分别为 $\psi_P, \varphi_Q$ 的逆，
  在给定的基下，$\sT'$, $\sT$的矩阵是相似的。
  故要证明 $\sT$ 可对角化, 只用证明 $\sT'$可对角化。
我们有
\[
\begin{aligned}
  \sT'(X) &= \psi_{P^{-1}}\circ \varphi_Q\circ \sT\circ \varphi_{Q^{-1}}\circ \circ \psi_P(X) \\
  &=  \psi_{P^{-1}}\circ\varphi_Q\circ \sT(PXQ^{-1}) \\
&= \psi_{P^{-1}}\circ\varphi_Q(APX Q^{-1} + PXQ^{-1}B) \\
&=  P^{-1}A P X + XQ^{-1}BQ\\
&=  A'X + XB'.
\end{aligned}
\]
显然 
\[
  \sT'(e_{ij})= (\lambda_i-\mu_j) e_{ij}.
\]
这样$\sT'$在 $\bF^{n\times m}$ 的 基$(e_{11}, \cdots, e_{ij}, \cdots, e_{nm})$
下的矩阵是对角的。从而 $\sT$ 也可对角化。
\end{solution}


\begin{exercise}
  设 $A\in \bR^{n\times n}$ 的 $n$ 个复特征值 $\lambda_1,\cdots, \lambda_n$ 满足 
  对任意的 $i,j$有  $\lambda_i+\lambda_j\neq 0$.
  证明：
\begin{enumerate}
  \item 映射
 \[
    \sigma\colon \bR^{n\times n}\rightarrow \bR^{n\times n}, X\mapsto AX+XA^{\rT}.
  \]
    为可逆的线性变换。
  \item 设$C\in \bR^{n\times n}$为实对称矩阵,
    那么存在唯一的实对称矩阵$B$ 使得$AB+BA^{\rT}=C$.
  %\item\starmark 假设$A$ 的所有特征值 $\lambda_i$是实数且小于 $0$, 且 $C$ 正定。
  %  证明 (2) 中的 $B$ 正定。
\end{enumerate}
\end{exercise}

\begin{solution}
(1) 矩阵左乘和矩阵右乘都是线性的，且线性映射的和也线性，故$\sigma$是线性的。
我们知道 $A^{\rT}$ 与 $A$ 有相同的特征值。
由练习 \ref{0D6} 知 $\sigma$ 的特征值形如
$\lambda_i+\lambda_j\neq 0$. 
既然 $\sigma$ 的特征值都非零，$\sigma$可逆。
  \iffalse
(1) 矩阵左乘和矩阵右乘都是线性的，且线性映射的和也线性，故$\sigma$是线性的。
要证明 $\sigma$ 可逆，只用证明证明 $\sigma$ 是单射。
为此，设 $0=\sigma(X)=AX+XA^{\rT}$. 这样 $AX=X (-A^{\rT})$. 
从而 $A^k X=X(-A^{\rT}^{k}$, 进而$p_A(A) X=Xp_A(-A^{\rT}$. 
其中 $p_A(\lambda)$ 为  $A$ 的特征多项式。
由Hamilton-Cayley定理知 $p_A(A)=0$, 这样 $Xp_A(-A^{\rT})=0$.
令 $p_A(\lambda)=\prod_{i=1}^n(\lambda -\lambda_i)$.
那么 $p_A(-A^{\rT})=(-1)^n\prod_{i=1}^n (A+\lambda_i E)$. 
由于 $A+\lambda_i E$的特征值形如 $\lambda_j+\lambda_i$从而都是正数，
因此 $A+\lambda_i E$可逆，故而 $p_A(-A^{\rT})$ 可逆。这样 $X=0$.
这就证明了 $\sigma$ 是单射从而可逆。
\fi

%      (2) 令$V$是$n$阶实对称矩阵构成的$\bR^{n\times n}$的子空间。
%      显然$\sigma$可以限制为$V$上的线性变换$\sigma|_V$,
%      且$\sigma|_V$依然可逆 (因为核为$0$)，从而是双射。
%      这样若$C$是$n$阶实对称矩阵，则存在唯一的实对称矩阵$B$使得$\sigma|_V(B)=C$, 即$AB+BA^{\rT}=C$.

(2) 由于 $\sigma$ 可逆，可知存在唯一的 $B\in \bR^{n\times n}$ 使得
$C=\sigma(B)=AB+BA^{\rT}$. $B$实际上是对称的，因为
\[
  \sigma(B^{\rT})= AB^{\rT}+B^{\rT}A^{\rT} =C^{\rT} = C=\sigma(B)
\]
和 $\sigma$可逆表明 $B^{\rT}=B$.
\end{solution}


\begin{remark}\starmark
  形如 $AX+XA^{\rH}+Q=0$ (其中 $Q$ 为Hermite矩阵) 的矩阵方程被称为
  (连续) Lyapunov方程，出现在动力系统的稳定性分析中。
若复矩阵 $A$ 的所有特征值的实部都严格小于$0$, 则 $A$ 称为\emph{稳定的}。
当 $A$ 稳定时，解惟一地存在，且是个Hermite矩阵；实际上唯一解为
\[
  X= \int_0^{\infty} e^{At}Q e^{A^{\rH} t}\diff t.
\]
若$A$ 稳定且 $Q$正定 (转：半正定), 则唯一解 $X$ 正定 (转：半正定)。
\end{remark}

\begin{exercise}
  证明两个可交换的奇数阶实方阵有公共的实特征向量。
\end{exercise}

\begin{solution}
  令$A, B$为可交换的$n$阶实方阵，其中$n$是奇数。$A$有实特征值，比如$\lambda$.
  令$V_{\lambda}\subset \bR^{(n)}$为$A$的属于$\lambda$的特征子空间。
  $V_\lambda$是$B$的不变子空间，从而$B$有特征向量，这也是$A, B$的公共实特征向量。
\end{solution}


\begin{exercise}
  设 $A, B\in \bC^{n\times n}$, 且 $AB-BA$ 是 $A, B$ 的线性组合。
    证明$A, B$ 有公共特征向量。
\end{exercise}


\begin{solution}
  记 $AB-BA=a A + b B$, 其中 $a, b\in \bC$. 
    若 $a=b=0$, 则 $AB=BA$; 
\iffalse
    此时，$A$ 的特征子空间都是 $B$ 的不变子空间；
    这是因为若 $V_\lambda$ 是 $A$ 的特征值 $\lambda$ 的特征子空间，$v\in V_\lambda$ 是特征向量，
    那么由 $A(Bv)=B(Av)=B(\lambda v)=\lambda Bv$ 知 $Bv\in V_\lambda$.
    $B$ 限制到 $A$ 的任何一个特征子空间上都有个特征向量，这是 $A, B$ 公共的特征向量。
  \fi
  此时由 练习 \ref{07D} 知 $A,B$ 有公共特征向量。
  否则 $a\neq 0$ 或 $b\neq 0$. 不妨设 $a\neq 0$.
  记 $C=a A + b B$, 则有 $CB-BC=a C$. 
  要证明 $A, B$ 有公共的特征向量，只用证明 $C, B$ 有；
  因为若 $C, B$ 有公共的特征向量 $v$, 
  可设 $(a A+b B)v=Cv = cv, Bv=dv$, 其中 $c, d\in \bC$, 则
  \[ Av = \frac{c- bd}{a} v, \]
  故 $v$ 是 $A,B$ 公共特征向量。
  下面证明 $C, B$ 有公共的特征向量。
  注意到 等式 $CB-BC=aC$ 在替换 $B$ 为$\varepsilon E+B$ 后仍然成立。
  由于 $C$ 只有有限个特征值，
  通过替换 $B$ 为合适的 $\varepsilon E+B$, 
  我们可设存在某个 $B$ 的特征值 $\lambda$ 
  使得 $\lambda- a$ 不是 $C$ 特征值。 
  令 $v$ 是 $B$ 的属于 $\lambda$ 的特征向量，则
  \[ BCv=(CB-aC)v=(\lambda-a)Cv. \]
  故 $Cv=0$. 这样 $v$ 是 $C, B$ 的公共特征向量。证毕。
\end{solution}





\begin{exercise}
  设$A, B\in \bC^{n\times n}$, $AB=BA^2$, 且$A$的特征值的绝对值非$1$. 
  证明$A, B$有公共的特征向量。
\end{exercise}


\begin{solution}
若 $0$ 为 $A$ 的特征值，则 其相应的特征值子空间 $V_0$ 是 $B$-不变的，
因为 $A(Bv)=BA^2v=0,$ 对任意的 $v\in V_0$. 从而
$B|_{V_0}$ 有个特征向量，这是 $A, B$ 的公共的特征向量。
现在设 $A$ 有个非零的特征值 $0\neq \lambda\in \bC$. 
为了叙述方便，我们反证，因此假设 $A,B$ 没有公共的特征向量。
  设$Av_1=\lambda v_1$, 其中$0\neq v_1\in \bC^{(n)}$. 
  那么$ABv_1=BA^2v_1=\lambda^2 Bv_1$.
  因为 $A,B$ 没有公共的特征向量，所以 $Bv_1\neq 0$.
  因此 $\lambda^2$也是$A$的特征值。
  类似的论证表明 $\lambda^{2^k}$ ($k$是非负整数) 都是$A$的特征值。
  但$A$只有有限个特征值，故存在$0\leqslant n< m$使得$\lambda^{2^n}=\lambda^{2^m}$. 
  特别地，$|\lambda|=1$, 这与题设矛盾了。
故$A, B$有公共的特征向量。
\end{solution}


\begin{exercise}\label{204}
  设$A, B\in \bC^{n\times n}$满足$AB=aBA$且$A$可逆, 其中$a\in \bC$满足$|a|\neq 1$.
  证明：$B$幂零，且$A, B$有公共的特征向量。
\end{exercise}


\begin{solution}

  由于$A$可逆，$AB=aBA$, 即 $ABA^{-1}=aB$, 表明$B$与$aB$相似。
若$a=0$, 则$B=0$, 结论平凡。我们可设$a\neq 0$.
令$\lambda$ 为 $B$的一个特征值，$v$ 是相应的一个特征向量， 
那么$aBv=a\lambda v$, 故$a\lambda$是$aB$的特征值，从而是$B$的特征值 (因为$B$与$aB$相似)。
进而，$a^n \lambda$是$B$的特征值，对任意的正整数$n$.
因为$B$的特征值只有有限多个，存在整数$0\leqslant n<m$使得
$a^n \lambda =a^m \lambda$, 即$(a^{m}-a^n)\lambda=0$. 
这样$a^m=a^n$或$\lambda=0$.
$|a|\neq 1$且 $a\neq 0$ 蕴含了$a^m=a^n$不成立，所以$\lambda=0$. 
既然$B$的特征值都是$0$, 其特征多项式为$\lambda^n$. 
故由 Hamilton-Cayley定理知$B^n=0$.
这就证明了 $B$ 幂零。
现在考虑$B$的属于特征值$0$的特征子空间$W$. 
对$v\in W$有$Bv=0$. 这样$B(Av)=\frac{1}{a} ABv=0$, 从而$Av\in W$.
这说明$W$是$A$-不变子空间。$A|_W$有个特征向量，这同时是$A, B$的特征向量。
这就证明了$A, B$有公共的特征向量。
\end{solution}





\begin{exercise}\label{236}
  设$A, B\in \bF^{n\times n}$, 且$A$在 $\bF$ 中有$n$个两两不同的特征值。证明：
  \begin{enumerate}
    \item $A, B$可交换当且仅当它们能同时对角化。
    \item $\symcal{C}(A)=\bF[A]$, 其中$\symcal{C}(A)$为与$A$可交换的方阵构成的集合。
      更一般的结论见练习~\ref{081}。
  \end{enumerate}
\end{exercise}

\begin{solution}
  (1) ($\Rightarrow$) 由于$A$有$n$个两两不同的特征值，$A$可对角化。
  又$B$与$A$可交换，$A$的每个特征子空间 (这些都是一维)都是$B$的不变子空间，
  从而$A$的$n$个线性无关的特征向量也是$B$的特征向量。
  特别地，$A, B$可同时对角化。

  ($\Leftarrow$) 设 $A, B$可同时对角化，即存在 可逆矩阵$P$使得
  \[
    P^{-1}AP=\diag(\lambda_1, \cdots, \lambda_n), \quad 
    P^{-1}BP=\diag(\mu_1, \cdots, \mu_n)
  \]
  同时是对角矩阵。
  由 $P^{-1}AP$与$P^{-1}BP$可交换知 $A, B$可交换。

  (2) 显然$\bF[A]\subset \symcal{C}(A)$. 我们证$\symcal{C}(A)\subset \bF[A]$, 
  即与$A$可交换的方阵是$A$的多项式。
  设$A, B$可交换。由(1)知$A, B$可同时对角化。
  故存在$P\in\GL_n(\bF)$使得
  \[
    P^{-1}AP=\diag(\lambda_1, \cdots, \lambda_n), \quad P^{-1}BP=\diag(\mu_1, \cdots, \mu_n).
  \]
  利用Lagrange插值公式我们知存在次数小于$n$的多项式$f\in \bF[x]$使得$f(\lambda_i)=\mu_i$, 对任意$i$.
  这样
  \[
    P^{-1}BP=f(P^{-1}AP)=P^{-1}f(A)P. 
  \]
  从而$B=f(A)$.
\end{solution}




\begin{exercise}\label{0A8}
  设$A, B\in \bF^{n\times n}$可对角化。证明$A, B$可同时对角化当且仅当$A, B$可交换。
\end{exercise}


\begin{solution}

  ($\Rightarrow$) 是显然的，我们证明 ($\Leftarrow$)。

  \fangfa 由于$A$可对角化，$\bF^{(n)}$可写为$A$的特征子空间的直和：$\bF^{(n)}=V_1\oplus V_2\oplus \cdots \oplus V_s$.
  由于$A, B$可交换，$A$的特征子空间都是$B$的不变子空间。
  考虑线性变换$B|_{V_i}$. 其最小多项式整除$B$的最小多项式。
  由于$B$可对角化，其最小多项式是互异的首一一次因子的乘积，
  从而$B|_{V_i}$的最小多项式也是互异的首一一次因子的乘积，进
  而$B|_{V_i}$可对角化。
  这样存在$V_i$的基使得$B|_{V_i}$是对角方阵。
  这些基合并为$\bF^{(n)}$的基时，线性变换$B$在该基下的矩阵是对角的。
  显然$A$在该基下的矩阵也是对角的。这就证明了$A, B$可同时对角化。


  \fangfa  设$P^{-1}AP=\lambda_1 E_{l_1}\oplus \cdots \oplus\lambda_k E_{l_k}$, 
  其中$E_{l_j}$是单位矩阵，$\lambda_1, \cdots, \lambda_k$两两不同。
  由于$P^{-1}BP$与$P^{-1}AP$可交换，练习~\ref{077}~告诉我们
  $P^{-1}BP$形如$B_1\oplus \cdots \oplus B_k$, 其中$B_j$是与$E_{l_j}$同阶的方阵。
  由于$B$可对角化，每个$B_j$都可对角化。
  设$Q_j$使得$Q_j^{-1}B_j Q_j$是对角阵。令$Q=Q_1\oplus \cdots \oplus Q_k$.
  那么$(PQ)^{-1} A (PQ)$, $(PQ)^{-1} B(PQ)$同时是对角阵。
\end{solution}


\begin{exercise}
  设$A, B\in \bF^{n\times n}$可对角化且$AB=BA$. 证明$AB$可对角化。
\end{exercise}

\begin{solution}

  由练习~\ref{0A8}~知$A, B$可同时对角化，
  即存在$P\in \GL_n(\bF)$使得
  \[
    P^{-1}AP=\diag(\lambda_1, \cdots, \lambda_n), \quad P^{-1}BP=\diag(\mu_1, \cdots, \mu_n).
  \]
  这样
  \[
    P^{-1}ABP=\diag(\lambda_1\mu_1, \cdots, \lambda_n\mu_n).
  \]
  所以$AB$可对角化。
\end{solution}





\section{杂题}

\begin{exercise}
  证明不存在$\bC$上的四元多项式$p(a,b,c,d)$使得$p$对任意的$2$阶矩阵$A=\begin{pmatrix}
    a & b\\
    c& d
  \end{pmatrix}$的项取值时得到的总是$A$的特征值。
\end{exercise}

\begin{solution}

  假设存在。考虑$A=\begin{pmatrix}
    0 & z \\ 1 & 0
  \end{pmatrix}$. 其特征多项式为$\lambda^2-z$. 这样$p(0,z,1,0)^2=z$, 对任意的$z\in \bC$. 
  这表明$\sqrt{z}$是$z$的多项式，这不可能。
\end{solution}

\begin{exercise}
  设$A\in \bF^{n\times n}$非奇异。证明$A^{-1}$相似于$A^*$当且仅当
  存在非奇异的$B\in \bF^{n\times n}$使得$A=B^{-1} B^*$.
\end{exercise}


\begin{solution}

  $A^{-1}$是$A$的多项式。
\end{solution}

\begin{exercise}\label{07C}
  设$\cF=\{A_j\mid j\in J\}\subset \bC^{n\times n}$ 是$n$阶方阵的交换族，
  即 $\cF$ 中任意两个$A_j, A_{j'}$ 可交换。
  证明这个交换族有公共的特征向量，
  即存在$0\neq v\in \bC^{(n)}$使得$v$是每个$A_j$的特征向量。
\end{exercise}



\begin{solution}
\iffalse\fangfa  
  由于$ \bF^{n\times n}$有限维，通过取$\{A_j\mid j\in J\}$的极大线性无关组，
  我们可以假设$J$是有限集。
  \fangfa  对空间归纳，反证。
\fi
我们总有一个 $\cF$-不变子空间 (即该子空间是所有 $A_i$的不变子空间)，即 $\bC^{(n)}$. 
令 
\[
  m=\min\{ \dim V\mid \text{$V$ 是 $\bC^{(n)}$ 的非零的 $\cF$-不变子空间}\},
\]
并令 $W$ 是任意一个固定的 $m$ 维 $\cF$-不变子空间。 
 任取 $A \in \cF$.  由于 $W$ 是 $\cF$-不变的， $W$ 是 $A$-不变的， 
所以 存在某个$0\neq x_0 \in W$ 以及某个 $\lambda \in \bC$, 
使得 $Ax_0 = \lambda x_0$. 考虑 $W$ 的子空间 
\[
  W_{A,\lambda} = \{x \in W\mid Ax = \lambda x\}.
\]
$x_0 \in W_{A,\lambda}$ 表明 $W_{A,\lambda}$ 是 $W$ 的一个非零子空间。 
对任意的 $B \in \cF$ 以及任意的 $x \in W_{A,\lambda}$, 
$W$ 的 $\cF$-不变性保证了 $Bx \in W$. 由 $\cF$ 的交换性， 我们有
\[
  A(Bx) = (AB)x = (BA)x = B(Ax) = B(\lambda x) = \lambda(Bx).
\]
这表明 $Bx \in W_{A,\lambda}$. 于是， $W_{A,\lambda}$ 是 $\cF$-不变的且非零，
所以 $\dim W_{A,\lambda} \geqslant m$. 但是 $W_{A,\lambda} \subseteq W$ 表明
$\dim W_{A,\lambda} \leqslant m$, 只有 $W = W_{A,\lambda}$. 
至此我们已然证明： 对每个 $A \in \cF$, 存在某个$\lambda_A\in \bC$, 
使得对所有 $x \in W$ 都有 $Ax = \lambda_A x$. 
因此 $W$ 中每个非零向量都是 $\cF$ 中每个矩阵的一个特征向量。
\end{solution}



\begin{exercise}
  设 $A, B$ 是 $n$ 阶复矩阵，满足  $\rank (AB-BA)\leqslant 1$.
证明 
\begin{enumerate}
  \item $A$ 与 $B$ 有公共的特征向量。
\item $A, B$可同时上三角化。
\end{enumerate}
\end{exercise}

\begin{solution}

我们对阶 $n$ 归纳。
若 $\rank (AB-BA)=0$, 即 $AB=BA$,
则 $A, B$ 有公共的特征向量 (练习 \ref{07D})
且 $A, B$ 可同时上三角化 (练习 \ref{07B})。
  设 $\rank (AB-BA)=1$.
  可设 $A$ 是奇异的 (如果需要，可用合适的 $A - \varepsilon E$ 代替 $A$). 
  如果 $A$ 的零空间是 $B$-不变的，那么它就是一个非零的公共不变子空间，
  从而 $A, B$有公共的特征向量。
如果 $A$ 的零空间不是 $B$-不变的，那么 可取 $x \neq 0$ 使得 $Ax = 0$ 且 $ABx \neq 0$. 
既然 $Cx = ABx$, 存在$z \neq 0$, 使得 $C = ABxz^{\rT}$ (练习 \ref{02B}). 
对任何 $y$，有 
\[
\begin{aligned}
  (z^{\rT} y)ABx &= ABxz^{\rT}y=  Cy = ABy - BAy,\\
  BAy &=  AB(y - (z^{\rT} y)x),
\end{aligned}
\]
从而 $\im BA \subset \im AB \subset \im A$，$\im A$ 是 $B$-不变的。
而 $\im A$ 也是$A$-不变的，故存在可逆矩阵$P$使得 
\[
  A'\coloneq P^{-1} AP=\begin{pmatrix} A_{11} & A_{12} \\ 0 & A_{22} \end{pmatrix}, \quad
  B'\coloneq P^{-1}B P = \begin{pmatrix} B_{11} & B_{12} \\ 0 & B_{22} \end{pmatrix},
\]
其中 $A_{11}, B_{11} \in \bC^{k\times k}$，$1 \leqslant k < n$.
现在 $C'\coloneq P^{-1} CP$ 为
\[
   A'B'-B'A' = \begin{pmatrix} A_{11}B_{11} - B_{11}A_{11} & * \\
   0 & A_{22}B_{22} - B_{22}A_{22} \end{pmatrix}
 \]
 其秩为 $1$. 因此 $C'$ 的对角分块中至少有一个为零，而另一个的秩不超过 $1$.
 由归纳假设，$A_{11}, B_{11}$ 有公共的特征向量且可同时上三角化，
 $A_{22}, B_{22}$ 有公共的特征向量且可同时上三角化。
 这些公共的特征向量做零延拓后可给出 $A,B$的公共的特征向量。
 而且，可知 $A, B$可同时上三角化。
\end{solution}





\begin{exercise}\label{0CD}
  设$A\in \bF^{n\times n}$, $p(\lambda)$为$A$的特征多项式，证明
  \[
    p(\lambda)=\lambda^n - c_1 \lambda^{n-1} +\cdots + (-1)^{n-1} c_{n-1} \lambda + (-1)^n c_n,
  \]
  其中$c_j$是所有$j$阶主子式之和，即
  \[
    c_j=\sum_{1\leqslant i_1<\cdots<i_j\leqslant n}\det A\begin{pmatrix}
        i_1 \cdots i_j\\
        i_1\cdots i_j
      \end{pmatrix}.
    \]
\end{exercise}



\begin{solution}
  \fangfa  由练习 \ref{01A} 知
\[
\begin{aligned}
\det(\lambda E - A)&=  \sum (-1)^{i_1+\cdots+i_k + j_1+\cdots +j_k } 
\det \left( (\lambda E) \begin{pmatrix}
  i_1 \cdots i_k\\ j_{1}\cdots j_k
\end{pmatrix}\right) \det \left( (-A)\begin{pmatrix}
  i_{k+1} \cdots i_n\\ j_{k+1}\cdots j_n
\end{pmatrix}\right)\\
&=  \sum_{k=0}^n \lambda^k \left( \sum_{1\leqslant i_{k+1}<\cdots<i_n\leqslant n} 
  \det \left( (-A)\begin{pmatrix}
    i_{k+1} \cdots i_n\\ i_{k+1}\cdots i_n
\end{pmatrix}\right)\right) \\
&= \lambda^n - c_1 \lambda^{n-1} +\cdots + (-1)^{n-1} c_{n-1} \lambda + (-1)^n c_n.
\end{aligned}
\]
  
  \fangfa  %下面的方法适用于基域是数域，这时我们可以放在复数域中看。
  设
  \[
    p(-\lambda)=(-1)^n\det (\lambda E+A)=(-1)^n\sum_{i=0}^n a_i\lambda^i.
  \]
    只用证明$a_j=c_{n-j}$, 对任意的$0\leqslant j<n$. 
  我们归纳地证明$0\leqslant j<n$时
  \[
    \frac{d^j}{d\lambda^j} \det (\lambda E+A)
    =
    j!\sum_{i_1<\cdots<i_{n-j}} 
    \det 
    \left( 
      \lambda c_{n-j} + A\begin{pmatrix}
        i_1 \cdots i_{n-j}\\
        i_1 \cdots i_{n-j}
    \end{pmatrix}
  \right).
  \]
  我们知道$\frac{d^j}{d\lambda^j} \det (\lambda E+A)$的常数项为$j!a_j$,
  所以取$\lambda=0$可知$a_j=c_{n-j}$. 
  $j=0$时没什么可证。考虑$0<j<n$. 我们有
  \[
  \begin{aligned}
    \frac{d^j}{d\lambda^j} \det (\lambda E+A) 
    &= \frac{d}{d\lambda} \left( \frac{d^{j-1}}{d\lambda^{j-1}} \det (\lambda E+A) \right) \\
    &= \frac{d}{d\lambda} (j-1)!\sum_{i_1<\cdots<i_{n-j+1}} 
    \det 
    \left( 
      \lambda c_{n-j} + A\begin{pmatrix}
        i_1 \cdots i_{n-j+1}\\
        i_1 \cdots i_{n-j+1}
    \end{pmatrix}
  \right) \\
  &= (j-1)! \sum_{i_1<\cdots<i_{n-j+1}} \frac{d}{d\lambda} \begin{pmatrix}
    \lambda+a_{i_1i_1} & a_{i_1i_2} & \cdots & \cdots  & a_{i_1i_{n-j+1}} \\
    a_{i_2i_1} & \lambda + a_{i_2i_2} & \cdots & \cdots  & a_{i_2i_{n-j+1}} \\
    \vdots  & \vdots & & \vdots \\
    a_{i_{n-j+1} i_1} & a_{i_{n-j+1} i_2} & \cdots & \cdots  & \lambda + a_{i_{n-j+1} i_{n-j+1}}
  \end{pmatrix} \\
  \iffalse
  &= (j-1)! \sum_{i_1<\cdots<i_{n-j+1}} \left( 
    \begin{pmatrix}
    1 & a_{i_1i_2} & \cdots & \cdots  & a_{i_1i_{n-j+1}} \\
    0 & \lambda + a_{i_2i_2} & \cdots & \cdots  & a_{i_2i_{n-j+1}} \\
    \vdots  & \vdots & & \vdots \\
    0 & a_{i_{n-j+1} i_2} & \cdots & \cdots  & \lambda+ a_{i_{n-j+1} i_{n-j+1}}
  \end{pmatrix}+  \begin{pmatrix}
    \lambda+a_{i_1i_1} & 0 & \cdots & \cdots  & a_{i_1i_{n-j+1}} \\
    a_{i_2i_1} & 1 & \cdots & \cdots  & a_{i_2i_{n-j+1}} \\
    \vdots  & \vdots & & \vdots \\
    a_{i_{n-j+1} i_1} & 0 & \cdots & \cdots  & \lambda+ a_{i_{n-j+1} i_{n-j+1}}
  \end{pmatrix}+\cdots +  \begin{pmatrix}
    \lambda+a_{i_1i_1} & a_{i_1i_2} & \cdots & \cdots  & 0 \\
    a_{i_2i_1} & \lambda + a_{i_2i_2} & \cdots & \cdots  & 0\\
    \vdots  & \vdots & & \vdots \\
    a_{i_{n-j+1} i_1} & a_{i_{n-j+1} i_2} & \cdots & \cdots  & 1
\end{pmatrix}\right) \\
\fi
&\overset{\circled{1}}{=} (j-1)! \sum_{i_1<\cdots<i_{n-j+1}} \sum_{k=1}^{n-j+1} 
  \det \left(\lambda c_{n-j} + A\begin{pmatrix}
      i_1 \cdots\widehat{i_{k}} \cdots i_{n-j+1}\\
      i_1\cdots \widehat{i_k} \cdots i_{n-j+1}
  \end{pmatrix}\right)\\
  &= j! \sum_{i_1<\cdots<i_{n-j}} 
    \det 
    \left( 
      \lambda c_{n-j} + A\begin{pmatrix}
        i_1 \cdots i_{n-j}\\
        i_1 \cdots i_{n-j}
    \end{pmatrix}
  \right),
  \end{aligned}
\]
其中 \circled{1} 用到了练习~\ref{0DC}，戴帽子的指标表示该指标不在其中。
\end{solution}


\begin{exercise}
  设$A\in \bC^{n\times n}$, 且$\lambda \in \bC$. 
  又设$k$是正整数。考虑如下三个命题：
  \begin{enumerate}[(a)]
    \item $\lambda$是几何重数$\geqslant k$的特征值；
    \item 只要$\tilde{A}$为$A$的一个$m$阶主子方阵，其中$m>n-k$, 
      那么$\lambda$为$\tilde{A}$的特征值；
    \item $\lambda$是代数重数$\geqslant k$的特征值。
  \end{enumerate}
  证明$(a)\Rightarrow (b) \Rightarrow (c)$.
\end{exercise}

\begin{solution}
  (a) $\Rightarrow$ (b) 设 $\lambda$ 是 $A$ 的几何重数至少为 $k$ 的特征值，
  这就意味着 $\rank (\lambda E - A) \leqslant n - k$.
  假设 $m > n - k$. 那么 $\lambda E - A $ 的每个 $m \times m$ 子式是零。
  特别地，$A - \lambda E$ 的每个 $m \times m$ 主子式是零的，
  故而 $\lambda E - A $ 的每个 $m \times m$ 主子矩阵是奇异的。
  于是，$\lambda$ 是 $A$ 的每个 $m \times m$ 主子矩阵的特征值。
 
(b) $\Rightarrow$ (c) 假设对每个 $m > n - k$，$\lambda$ 是 
$A$ 的每个 $m \times m$ 主子矩阵的特征值。
那么，$ A- \lambda E $ 的每个阶至少为 $n - k + 1$ 的主子式都是零，
所以，对任意的 $j \geqslant n - k + 1$, 所有 $j$ 阶主子式之和为 $0$.
这样由 练习 \ref{0CD} 知 $\lambda^{k}$ 整除
$A-\lambda E$ 的特征多项式 $p_{A-\lambda E}(\lambda)$.
进而可知 $\lambda$ 是 $A$ 的特征多项式 $p_A(x)$ 的重数至少 $k$的零点，
因为 $p_{A-\lambda E}(x) = p_A(x + \lambda)$.
\end{solution}

每个复方阵都是近于可以对角化的。

\begin{exercise}
  设 $A = [a_{ij}] \in \bC^{n\times n}$. 对每个 $\epsilon > 0$，
  存在一个矩阵 $A(\epsilon) = (a_{ij}(\epsilon)) \in \bC^{n\times n}$,
  其有 $n$ 个不同的特征值 (于是它可以对角化)，且使得
\[
\sum_{i,j=1}^{n} |a_{ij} - a_{ij}(\epsilon)|^2 < \epsilon.
\]
\end{exercise}
 
\begin{solution}
设 $U \in \bC^{n\times n}$ 是酉矩阵，它使得 $U^*AU = T$ 是上三角的。
设 $E = \text{diag}(\epsilon_1, \epsilon_2, \cdots, \epsilon_n)$，其中 $\epsilon_1, \epsilon_2, \cdots, \epsilon_n$ 这样来选取，使得 $|\epsilon_i| < (\frac{\epsilon}{n})^{1/2}$，所以对所有 $i \neq j$ 都有 $t_{ii} + \epsilon_i \neq t_{jj} + \epsilon_j$. (考虑一下可以看出这可以做到.) 这样一来 $T + E$ 就有 $n$ 个不同的特征值 $t_{11} + \epsilon_1, \cdots, t_{nn} + \epsilon_n$，故而 $A + UEU^*$ 亦然，而后者与 $T + E$ 相似. 设 $A(\epsilon) = A + UEU^*$，所以 $A - A(\epsilon) = -UEU^*$，从而
\[
(2.2.2) \text{ 确保有 } \sum_{i,j} |a_{ij} - a_{ij}(\epsilon)|^2 = \sum_{i = 1}^{n} |\epsilon_i|^2 < n(\frac{\epsilon}{n}) = \epsilon.
\]
\end{solution}

\begin{exercise}[Gershgorin圆定理]
  设$A=(a_{ij})\in \bC^{n\times n}$. 证明$A$的任一特征值$z$都满足
  \[
    |z-a_{ii}|\leqslant \sum_{j\neq i}|a_{ij}|.
  \]
\end{exercise}


